Análisis Demográfico 1


Dr. Víctor Manuel García Guerrero

vmgarcia@colmex.mx

¿Qué es la demografía?

Tip

La demografía es la ciencia que tiene por objeto el estudio de la poblaciones humanas tratando, desde un punto de vista principalmente cuantitativo, su dimensión, estructura, evolución y características generales.

Población

Tip

  • Colección de personas vivas en un punto determinado en el tiempo que cumplen con ciertos criterios.
    • La población de Guatemala de 1 de julio del 2010
    • La población de mujeres indígenas en edad reproductiva en el sureste mexicano al 1 de enero de 2011
  • Colectividad que persiste a lo largo del tiempo auqnue sus miembros estén en continuo cambio.
    • La población de Mexico

¿Qué es la demografía?

Tip

“[…] en definitiva puede considerarse que las investigaciones realizadas en el marco restringido del análisis demográfico constituyen el ‘nucleo’ de la demografía como ciencia, bien entendido que tales investigaciones conciernen exclusivamente al estudio del tamaño, distribución territorial y composición de la población como así también a sus cambios y a los componentes de tales cambios”

.

.

``

``

##``

``

``

``

``

.

.

.

.

.

¿Qué es la demografía?

Tip

  • Conceptos basicos y medidad
  • Fuentes de información en demografía (evaluación y corrección )
  • Tasas por edad específica y probabilidad
  • Procesos de decremento simple: La tabla de mortalidad
  • Procesos de decremento múltiple
  • Fecundidad y reproducción
  • Modelación de los patrones por edad de los eventos vitales

Bibliografía

Evaluación

Tip

  • 2 tareas examen 30%
  • 1 examen final 50%
  • Tareas 20%

Materiales

Tip

  • Computadora (con R y RStudio instalado)
  • Pluma y lápiz
  • Cuaderno carta cuadro chico (obligatorio)

Fuentes de información en demografía

Tip

  • Censos (de facto, de jure)
  • Estadísticas Vitales
  • Encuestas
  • Fuentes secundarias( estimaciones y proyecciones, repositorios estadarizados)

Fuentes de información en demografía

Censo de facto

Es un método de conteo de individuos basado en dónde se encuentran físicamente en el momento del censo, independientemente de su lugar de residencia habitual. Puede ser particularmente útil para ciertas necesidades de recopilación de datos a corto plazo, pero puede no siempre proporcionar la imagen más precisa para la planificación y asignación de recursos a largo plazo. * Presencia física * Instantánea en el tiempo * Enumeración simplificada

Fuentes de información en demografía

Ventajas de un censo de facto

  • Simplicidad: Más fácil de administrar porque solo considera d ́onde están las personas el día del censo.
  • Reducción del doble conteo: Minimiza el riesgo de contar a los individuos más de una vez, especialmente aquellos con múltiples residencias.
  • Eficiente para Poblaciones Temporales: Captura datos sobre poblaciones temporales como turistas, viajeros de negocios y trabajadores estacionales.
  • Recopilación de datos inmediata: Facilita una recopilación de datos más rápida ya que no implica rastrear residencias habituales o patrones de migración.

Fuentes de información en demografía

Desventajas de un censo de facto

  • Sesgo temporal: Puede no representar con precisión a la población residente habitual, particularmente en áreas con alta población de turistas o transitoria.
  • Inexactitud para la asignación de recursos: Puede llevar a inexactitudes en la asignación de recursos y la planificación de políticas, ya que no refleja dónde viven y usan servicios las personas habitualmente.
  • Sobrerrepresentación de ciertas áreas: Las áreas con eventos o grandes poblaciones temporales (por ejemplo, convenciones, festivales) pueden estar sobrerrepresentadas.
  • Desconsideración de la residencia habitual: Ignora dónde residen típicamente los individuos y contribuyen a la vida comunitaria.

Fuentes de información en demografía

Censo de jure

Es un método de conteo de individuos basado en su lugar de residencia habitual, independientemente de dónde se encuentren físicamente en el momento del censo. Un censo de jure es esencial para obtener una visión precisa y estable de la población residente, crucial para una planificación efectiva y la asignación de recursos a largo plazo.

  • Lugar de residencia habitual.
  • Reflejo de la residencia permanente.
  • Complejidad de enumeración.

Fuentes de información en demografía

Ventajas de un censo de jure

  • Precisión en la planificación de recursos: Proporciona datos más precisos para la asignaci ́on de recursos y la planificaci ́on de pol ́ıticas pu ́blicas, reflejando la residencia permanente de la poblaci ́on.
  • Representaci ́on exacta: Mejora la precisión en la representación política y distribución de distritos electorales.
  • Datos estables: Ayuda a obtener una imagen m ́as estable y menos fluctuante de la población , útil para la planificación a largo plazo.
  • Adecuado para políticas sociales: Proporciona información relevante para servicios sociales, infraestructura y desarrollo comunitario, basada en la residencia habitual de las personas.

Fuentes de información en demografía

Desventajas de un censo de jure

  • Complejidad y costos: Más difícil ıcil y costoso de administrar debido a la necesidad de verificar la residencia habitual.
  • Riesgo de doble conteo: Puede haber problemas con individuos que tienen múltiples residencias o migran frecuentemente, lo que puede llevar a errores o doble conteo.
  • Subnotificación: Algunos individuos pueden no ser contados si no se encuentran en su residencia habitual el día del censo o si no se reportan correctamente.
  • Desafíos de enumeración: Puede ser difícil rastrear y contar a personas sin hogar, nómadas, o aquellos en situaciones de vivienda inestables.

Fuentes de información en demografía

En resumen

  • Censo De Jure: Cuenta a los individuos según su lugar de residencia habitual, proporcionando datos sobre donde la población vive y usa servicios regularmente.
  • Censo De Facto: Cuenta a los individuos según su ubicación física el día del censo, ofreciendo una instantánea de la población en un momento específico.

Fuentes de información en demografía

Ventajas de los censos

  • Datos Completos
  • Precisión
  • Referencia
  • Asignación de recursos Análisis de tendencias

Fuentes de información en demografía

Limitaciones de los censos

  • Costo
  • Consumo de tiempo
  • Desafiós logísticos
  • Frecuencia
  • Preocupaciones de privacidad
  • No respuesta (subcobertura)
  • Mala declaración de edad y sexo

Fuentes de información en demografía

Mala declaración de edad y sexo

  • Inexactitud de datos
  • Tendencias demográficas distorsionadas
  • Mala asignación de recursos
  • Implicaciones políticas
  • Integridad del censo

Fuentes de información en demografía

Mitigación de la mala declaración de edad y sexo

  • Capacitación de enumeradores.
  • Campañas de concientizacin pú́blica
  • Uso de tecnología.
  • Verificación cruzada.

Fuentes de información en demografía

Evaluación

Fuentes de información en demografía

Evaluación

Prorateo de población no es especificada

El prorateo de la población no especificada es una técnica en el análisis demografico para distribuir o asignar de manera proporcional una poblacion no especificada a la población determinada por una categoría.

\(N^*_x = N_x + N_{ne} \frac{N_x}{\sum_{x=0}^w N_x}\)

Fuentes de información en demografía

Evaluación

\(N^*_x = N_x + N_{ne} \frac{N_x}{\sum_{x=0}^w N_x}\)

Donde:

\(N^*_x\) es la nueva población total ajustada a la población no especificada de edad x

\(N_x\) total de la población de edad x

\(N_{ne}\) total de la población no especificada.

\(\frac{N_x}{\sum_{x=0}^w N_x}\) es la proporcion del total de la poblacion de edad x, \(N_x\), con respectoa la población total.

Fuentes de información en demografía

Operaciones en bases de datos

Left join

Un left join es una operación en bases de datos que combina dos tablas, con base a una columna en común entre ellas y tomando en cuenta todas las filas de la tabla izquierda. Si no hay coincidencias en la en la tabla derecha, entonces éstas aparecenran con valores null en la nueva tabla.

Fuentes de información en demografía

Operaciones en bases de datos-Ejemplo

# Cargar el paquete dplyr
library(dplyr)

# Crear la primera tabla (izquierda)
tabla_izq <- data.frame(
  id = c(1, 2, 3, 4),
  nombre = c("Juan", "María", "Pedro", "Ana")
)

# Crear la segunda tabla (derecha)
tabla_der <- data.frame(
  id = c(1, 3, 4, 5),
  ciudad = c("Madrid", "Barcelona", "Valencia", "Sevilla")
)

# Realizar el left join
resultado <- left_join(tabla_A, tabla_B, by = "id")

Fuentes de información en demografía

Operaciones en bases de datos-Ejemplo

# Cargar el paquete dplyr
library(dplyr)

# Crear la primera tabla (izquierda)
tabla_izq <- data.frame(
  id = c(1, 2, 3, 4),
  nombre = c("Juan", "María", "Pedro", "Ana")
)

# Crear la segunda tabla (derecha)
tabla_der <- data.frame(
  id = c(1, 3, 4, 5),
  ciudad = c("Madrid", "Barcelona", "Valencia", "Sevilla")
)

# Realizar el left join
resultado <- left_join(tabla_A, tabla_B, by = "id")

Nota

Observe que en la tabla “derecha” no hay coincidencias para el id=2

Fuentes de información en demografía

Operaciones en bases de datos-Ejemplo

# Cargar el paquete dplyr
library(dplyr)

# Crear la primera tabla (izquierda)
tabla_izq <- data.frame(
  id = c(1, 2, 3, 4),
  nombre = c("Juan", "María", "Pedro", "Ana")
)

# Crear la segunda tabla (derecha)
tabla_der <- data.frame(
  id = c(1, 3, 4, 5),
  ciudad = c("Madrid", "Barcelona", "Valencia", "Sevilla")
)

# Realizar el left join
resultado <- left_join(tabla_izq, tabla_der, by = "id")

Fuentes de información en demografía

Prorateo de la base de datos base_mx

base_mx_pror <- left_join(
  base_mx %>% 
    filter(do == "Total") %>% 
    group_by(sex) %>% 
    mutate(prop = pob / sum(pob)) %>% 
    filter(is.na(age) == F) %>%
    ungroup(),
  base_mx %>% 
    filter(edo == "Total", is.na(age) == T) %>% 
    select(sex, pob_na = pob),
  by = "sex")  %>% 
  mutate(pob_fin = pob + pob_na * prop) %>% 
  select(age, sex, pob = pob_fin)

contents…

Fuentes de información en demografía

Prorateo de la base de datos base_mx

base_mx_pror <- left_join(
  base_mx %>% 
    filter(do == "Total") %>% 
    group_by(sex) %>% 
    mutate(prop = pob / sum(pob)) %>% 
    filter(is.na(age) == F) %>%
    ungroup(),
  base_mx %>% 
    filter(edo == "Total", is.na(age) == T) %>% 
    select(sex, pob_na = pob),
  by = "sex")  %>% 
  mutate(pob_fin = pob + pob_na * prop) %>% 
  select(age, sex, pob = pob_fin)

contents…

Fuentes de información en demografía

Prorateo de la base de datos base_mx

base_mx_pror <- left_join(
  base_mx %>% 
    filter(do == "Total") %>% 
    group_by(sex) %>% 
    mutate(prop = pob / sum(pob)) %>% 
    filter(is.na(age) == F) %>%
    ungroup(),
  base_mx %>% 
    filter(edo == "Total", is.na(age) == T) %>% 
    select(sex, pob_na = pob),
  by = "sex")  %>% 
  mutate(pob_fin = pob + pob_na * prop) %>% 
  select(age, sex, pob = pob_fin)

contents…

Fuentes de información en demografía

Prorateo de la base de datos base_mx

base_mx_pror <- left_join(
  base_mx %>% 
    filter(do == "Total") %>% 
    group_by(sex) %>% 
    mutate(prop = pob / sum(pob)) %>% 
    filter(is.na(age) == F) %>%
    ungroup(),
  base_mx %>% 
    filter(edo == "Total", is.na(age) == T) %>% 
    select(sex, pob_na = pob),
  by = "sex")  %>% 
  mutate(pob_fin = pob + pob_na * prop) %>% 
  select(age, sex, pob = pob_fin)

Nota

Resultado tabla “izquierda”

contents…

Fuentes de información en demografía

Prorateo de la base de datos base_mx

base_mx_pror <- left_join(
  base_mx %>% 
    filter(do == "Total") %>% 
    group_by(sex) %>% 
    mutate(prop = pob / sum(pob)) %>% 
    filter(is.na(age) == F) %>%
    ungroup(),
  base_mx %>% 
    filter(edo == "Total", is.na(age) == T) %>% 
    select(sex, pob_na = pob),
  by = "sex")  %>% 
  mutate(pob_fin = pob + pob_na * prop) %>% 
  select(age, sex, pob = pob_fin)

contents…

Fuentes de información en demografía

Prorateo de la base de datos base_mx

base_mx_pror <- left_join(
  base_mx %>% 
    filter(do == "Total") %>% 
    group_by(sex) %>% 
    mutate(prop = pob / sum(pob)) %>% 
    filter(is.na(age) == F) %>%
    ungroup(),
  base_mx %>% 
    filter(edo == "Total", is.na(age) == T) %>% 
    select(sex, pob_na = pob),
  by = "sex")  %>% 
  mutate(pob_fin = pob + pob_na * prop) %>% 
  select(age, sex, pob = pob_fin)

Nota

Resultado tabla “derecha”

contents…

Fuentes de información en demografía

Prorateo de la base de datos base_mx

base_mx_pror <- left_join(
  base_mx %>% 
    filter(do == "Total") %>% 
    group_by(sex) %>% 
    mutate(prop = pob / sum(pob)) %>% 
    filter(is.na(age) == F) %>%
    ungroup(),
  base_mx %>% 
    filter(edo == "Total", is.na(age) == T) %>% 
    select(sex, pob_na = pob),
  by = "sex")  %>% 
  mutate(pob_fin = pob + pob_na * prop) %>% 
  select(age, sex, pob = pob_fin)

contents…

Fuentes de información en demografía

Prorateo de la base de datos base_mx

base_mx_pror <- left_join(
  base_mx %>% 
    filter(do == "Total") %>% 
    group_by(sex) %>% 
    mutate(prop = pob / sum(pob)) %>% 
    filter(is.na(age) == F) %>%
    ungroup(),
  base_mx %>% 
    filter(edo == "Total", is.na(age) == T) %>% 
    select(sex, pob_na = pob),
  by = "sex")  %>% 
  mutate(pob_fin = pob + pob_na * prop) %>% 
  select(age, sex, pob = pob_fin)

contents…

Fuentes de información en demografía

Prorateo de la base de datos base_mx

base_mx_pror <- left_join(
  base_mx %>% 
    filter(do == "Total") %>% 
    group_by(sex) %>% 
    mutate(prop = pob / sum(pob)) %>% 
    filter(is.na(age) == F) %>%
    ungroup(),
  base_mx %>% 
    filter(edo == "Total", is.na(age) == T) %>% 
    select(sex, pob_na = pob),
  by = "sex")  %>% 
  mutate(pob_fin = pob + pob_na * prop) %>% 
  select(age, sex, pob = pob_fin)

contents…

Fuentes de información en demografía

Evaluación

Índice de Whipple (preferencia por dígitos 0 y 5)

\[ \begin{aligned} W = 5\frac{N_{25}+N_{30}+N_{35}+...+N_{55}+N_{60}}{N_{23}+N_{24}+N_{25}+...+N_{55}+N_{62}} \end{aligned} \] \(W\in[1,5]\) donde 1 indica no prefencia de dígitos y 5 una alta preferencia.

Fuentes de información en demografía

Índice de Wipple, usando la tabla de datos base_mx_pror

Tabla izquierda

Code
library(tidyverse)
library(DT)
load("input/base_mx_pror.RData")
tabla_izq <- base_mx_pror %>% 
    filter(
      age %in% c(25:60),
      age %% 10 == 0 | age %% 10 == 5
    )
datatable(tabla_izq, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Wipple, usando la tabla de datos base_mx_pror

Code
library(tidyverse)
library(DT)

tabla_izq <- base_mx_pror %>% 
    filter(
      age %in% c(25:60),
      age %% 10 == 0 | age %% 10 == 5
    ) %>% 
    group_by(sex) %>% 
    summarise(pob_num = sum(pob), .groups = "drop")
datatable(tabla_izq, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Wipple, usando la tabla de datos base_mx_pror

Tabla derecha

Code
library(tidyverse)
library(DT)

tabla_der <- base_mx_pror %>% 
    filter(age %in% c(23:62))
datatable(tabla_der, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Wipple, usando la tabla de datos base_mx_pror

Code
library(tidyverse)
library(DT)

tabla_der <-base_mx_pror %>% 
    filter(age %in% c(23:62)) %>% 
    group_by(sex) %>% 
    summarise(pob_den = sum(pob), ,groups = "drop")
datatable(tabla_der, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Wipple, usando la tabla de datos base_mx_pror

Juntando tabla_izq y tabla_der

Code
library(tidyverse)
library(DT)
tabla_izq <- base_mx_pror %>% 
    filter(
      age %in% c(25:60),
      age %% 10 == 0 | age %% 10 == 5
    ) %>% 
    group_by(sex) %>% 
    summarise(pob_num = sum(pob), .groups = "drop")
tabla_der <-base_mx_pror %>% 
    filter(age %in% c(23:62)) %>% 
    group_by(sex) %>% 
    summarise(pob_den = sum(pob), ,groups = "drop")
tabla <- left_join(tabla_izq,tabla_der,by="sex")
datatable(tabla, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Wipple, usando la tabla de datos base_mx_pror

Aqui mostramos el resultado del calculo del Índice de Wipple W

Code
library(tidyverse)
library(DT)
tabla_izq <- base_mx_pror %>% 
    filter(
      age %in% c(25:60),
      age %% 10 == 0 | age %% 10 == 5
    ) %>% 
    group_by(sex) %>% 
    summarise(pob_num = sum(pob), .groups = "drop")
tabla_der <-base_mx_pror %>% 
    filter(age %in% c(23:62)) %>% 
    group_by(sex) %>% 
    summarise(pob_den = sum(pob), ,groups = "drop")
tabla <- left_join(tabla_izq,tabla_der,by="sex") %>% 
  mutate(W = 5 * pob_num / pob_den)
datatable(tabla, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Evaluación

Índice de Myers

Myers (1940) desarrolló un índice “combinado” para medir la preferencia de los 10 dígitos (Myers 1954). El método determina la proporción de la población cuya edad termina en cada dígito terminal (0-9), variando también la edad de inicio particular para cualquier grupo de edad de 10 años. Se basa en el principio de que, en ausencia de redondeo de edades, la población agregada en cada dígito terminal 0-9 debería representar aproximadamente el 10 por ciento de la población total. Su valor oscila entre 0 (no concentración de edades) a 90 (total concentración en una edad)

Fuentes de información en demografía

Evaluación

Tip

El método implica 5 pasos principales (Siegel Jacob y Swanson David 2004):

  • Sumar las poblaciones que terminan en cada dígito sobre todo el rango, comenzando con el límite inferior del rango (por ejemplo, 10,20,30,…,80; 11,21,31,…,81).

  • Determinar la suma excluyendo la primera población en cada grupo del paso 1 (por ejemplo, 20,30,…,80; 21,31,…,81).

  • Ponderar las sumas de los pasos 1 y 2 y sumar los resultados para obtener una población combinada (por ejemplo, pesos 1 y 9 para el d ́ıgito 0; pesos 2 y 8 para el dígito 1).

  • Convertir la distribución del paso 3 en porcentajes.

  • Tomar la mitad de la suma de las desviaciones absolutas de cada porcentaje en el paso 4.

Fuentes de información en demografía

Índice de Myers con la tabla de datos base_mx_pror

Tabla izquierda

Code
library(tidyverse)
library(DT)
load("input/base_mx_pror.RData")
tabla_izq <- base_mx_pror %>% 
  filter(age %in% c(10:80))
datatable(tabla_izq, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Myers con la tabla de datos base_mx_pror

Code
library(tidyverse)
library(DT)
load("input/base_mx_pror.RData")
tabla_izq <-base_mx_pror %>% 
  filter(age %in% c(10:80)) %>% 
  mutate(digit = age %% 10)
datatable(tabla_izq, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Myers con la tabla de datos base_mx_pror

Code
library(tidyverse)
library(DT)
load("input/base_mx_pror.RData")
tabla_izq <- base_mx_pror %>% 
  filter(age %in% c(10:80)) %>% 
  mutate(digit = age %% 10) %>% 
  group_by(digit) %>% 
  summarise(step1 = sum(pob), .groups = "drop")
datatable(tabla_izq, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Myers con la tabla de datos base_mx_pror

Code
library(tidyverse)
library(DT)
load("input/base_mx_pror.RData")
tabla_izq <- base_mx_pror %>% 
  filter(age %in% c(10:80)) %>% 
  mutate(digit = age %% 10) %>% 
  group_by(digit) %>% 
  summarise(step1 = sum(pob), .groups = "drop") %>% 
  mutate(
    weights  = c(1:10),
    tot_pop1 = step1*weights)
datatable(tabla_izq, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Myers con la tabla de datos base_mx_pror

Tabla derecha

Code
library(tidyverse)
library(DT)
load("input/base_mx_pror.RData")
tabla_der <-  base_mx_pror %>% 
  filter(age %in% c(10:80)) 
datatable(tabla_der, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Myers con la tabla de datos base_mx_pror

Code
library(tidyverse)
library(DT)
load("input/base_mx_pror.RData")
tabla_der <- base_mx_pror %>% 
  filter(age %in% c(10:80)) %>% 
  mutate(digit = age %% 10)
datatable(tabla_der, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Myers con la tabla de datos base_mx_pror

Code
library(tidyverse)
library(DT)
load("input/base_mx_pror.RData")
tabla_der <-base_mx_pror %>% 
  filter(age %in% c(10:80)) %>% 
  mutate(digit = age %% 10) %>% 
  filter(!age %in% c(10:19)) 
datatable(tabla_der, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Myers con la tabla de datos base_mx_pror

Code
library(tidyverse)
library(DT)
load("input/base_mx_pror.RData")
tabla_der <- base_mx_pror %>% 
  filter(age %in% c(10:80)) %>% 
  mutate(digit = age %% 10) %>% 
  filter(!age %in% c(10:19)) %>% 
  group_by(digit) %>% 
  summarise(step2 = sum(pob), .groups = "drop") 
datatable(tabla_der, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Myers con la tabla de datos base_mx_pror

Code
library(tidyverse)
library(DT)
load("input/base_mx_pror.RData")
tabla_der <- base_mx_pror %>% 
  filter(age %in% c(10:80)) %>% 
  mutate(digit = age %% 10) %>% 
  filter(!age %in% c(10:19)) %>% 
  group_by(digit) %>% 
  summarise(step2 = sum(pob), .groups = "drop") %>% 
  mutate (
    weights = c(9:0),
    tot_pop2 = step2*weights)
datatable(tabla_der, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Myers con la tabla de datos base_mx_pror

Tabla de datos myers_tab, juntando tabla_izq y tabla_der

Code
library(tidyverse)
library(DT)
load("input/base_mx_pror.RData")
tabla_izq <- base_mx_pror %>% 
  filter(age %in% c(10:80)) %>% 
  mutate(digit = age %% 10) %>% 
  group_by(digit) %>% 
  summarise(step1 = sum(pob), .groups = "drop") %>% 
  mutate(
    weights  = c(1:10),
    tot_pop1 = step1*weights)
tabla_der <- base_mx_pror %>% 
  filter(age %in% c(10:80)) %>% 
  mutate(digit = age %% 10) %>% 
  filter(!age %in% c(10:19)) %>% 
  group_by(digit) %>% 
  summarise(step2 = sum(pob), .groups = "drop") %>% 
  mutate (
    weights = c(9:0),
    tot_pop2 = step2*weights)
myers_tab <- left_join(tabla_izq,tabla_der,by = "digit")
datatable(myers_tab, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Myers con la tabla de datos base_mx_pror

Code
library(tidyverse)
library(DT)
load("input/base_mx_pror.RData")
tabla_izq <- base_mx_pror %>% 
  filter(age %in% c(10:80)) %>% 
  mutate(digit = age %% 10) %>% 
  group_by(digit) %>% 
  summarise(step1 = sum(pob), .groups = "drop") %>% 
  mutate(
    weights  = c(1:10),
    tot_pop1 = step1*weights)
tabla_der <- base_mx_pror %>% 
  filter(age %in% c(10:80)) %>% 
  mutate(digit = age %% 10) %>% 
  filter(!age %in% c(10:19)) %>% 
  group_by(digit) %>% 
  summarise(step2 = sum(pob), .groups = "drop") %>% 
  mutate (
    weights = c(9:0),
    tot_pop2 = step2*weights)
myers_tab <- left_join(tabla_izq,tabla_der,by = "digit")  %>% 
  select(digit,tot_pop1,tot_pop2)
datatable(myers_tab, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Myers con la tabla de datos base_mx_pror

Code
library(tidyverse)
library(DT)
load("input/base_mx_pror.RData")
tabla_izq <- base_mx_pror %>% 
  filter(age %in% c(10:80)) %>% 
  mutate(digit = age %% 10) %>% 
  group_by(digit) %>% 
  summarise(step1 = sum(pob), .groups = "drop") %>% 
  mutate(
    weights  = c(1:10),
    tot_pop1 = step1*weights)
tabla_der <- base_mx_pror %>% 
  filter(age %in% c(10:80)) %>% 
  mutate(digit = age %% 10) %>% 
  filter(!age %in% c(10:19)) %>% 
  group_by(digit) %>% 
  summarise(step2 = sum(pob), .groups = "drop") %>% 
  mutate (
    weights = c(9:0),
    tot_pop2 = step2*weights)
myers_tab <- left_join(tabla_izq,tabla_der,by = "digit")  %>% 
  select(digit,tot_pop1,tot_pop2) %>% 
  mutate(blended = tot_pop1 + tot_pop2,
         blend_perc = 100*blended/sum(blended),
         deviat = abs(blend_perc-10 ))
datatable(myers_tab, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Índice de Myers con la tabla de datos base_mx_pror

Code
library(tidyverse)
library(DT)
load("input/base_mx_pror.RData")
tabla_izq <- base_mx_pror %>% 
  filter(age %in% c(10:80)) %>% 
  mutate(digit = age %% 10) %>% 
  group_by(digit) %>% 
  summarise(step1 = sum(pob), .groups = "drop") %>% 
  mutate(
    weights  = c(1:10),
    tot_pop1 = step1*weights)
tabla_der <- base_mx_pror %>% 
  filter(age %in% c(10:80)) %>% 
  mutate(digit = age %% 10) %>% 
  filter(!age %in% c(10:19)) %>% 
  group_by(digit) %>% 
  summarise(step2 = sum(pob), .groups = "drop") %>% 
  mutate (
    weights = c(9:0),
    tot_pop2 = step2*weights)
myers_tab <- left_join(tabla_izq,tabla_der,by = "digit")  %>% 
  select(digit,tot_pop1,tot_pop2) %>% 
  mutate(blended = tot_pop1 + tot_pop2,
         blend_perc = 100*blended/sum(blended),
         deviat = abs(blend_perc-10 ))
myers_tab <-myers_tab %>% 
  summarise(myers = sum(deviat)/2)
datatable(myers_tab, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Evaluación

Tip

  • Bachi 1951
  • Noumbissi 1992
  • Spoorenberg 2007
  • Coale-Li 1991
  • Jdanov 2008

Fuentes de información en demografía

Corrección

  • Agrupar por edades quinquenales
  • Utilizar algún método de graduación ( degradación en edades simples)

Fuentes de información en demografía

Agrupación por edades quinquenales con la tabla de datos base_mx_pror

Definamos la secuencia de límites para las edades quinquenales.

Code
bins <- seq(0,max(base_mx_pror$age)+5,by = 5)
bins
 [1]   0   5  10  15  20  25  30  35  40  45  50  55  60  65  70  75  80  85  90
[20]  95 100 105

Fuentes de información en demografía

Agrupación por edades quinquenales con la tabla de datos base_mx_pror

Definamos la secuencia de límites para las edades quinquenales.

Code
bins   <- seq(0,max(base_mx_pror$age)+5,by = 5)
labels <- paste(bins[-length(bins)],
                bins[-1]-1,
                sep="-")
labels
 [1] "0-4"     "5-9"     "10-14"   "15-19"   "20-24"   "25-29"   "30-34"  
 [8] "35-39"   "40-44"   "45-49"   "50-54"   "55-59"   "60-64"   "65-69"  
[15] "70-74"   "75-79"   "80-84"   "85-89"   "90-94"   "95-99"   "100-104"

Fuentes de información en demografía

Agrupación por edades quinquenales con la tabla de datos base_mx_pror

Definamos la secuencia de límites para las edades quinquenales.

Code
library(tidyverse)
library(DT)
load("Input/base_mx_pror.RData")
bins   <- seq(0,max(base_mx_pror$age)+5,by = 5)
labels <- paste(bins[-length(bins)],
                bins[-1]-1,
                sep="-")
base_mx_pror <- base_mx_pror %>% 
  mutate(age_group = cut(age,breaks = bins,
                         labels = labels, right = FALSE))
datatable(base_mx_pror, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Agrupación por edades quinquenales con la tabla de datos base_mx_pror

Tabla de datos agrupados por edades quinquenales base_mx_5

Code
library(tidyverse)
library(DT)
load("Input/base_mx_pror.RData")
bins   <- seq(0,max(base_mx_pror$age)+5,by = 5)
labels <- paste(bins[-length(bins)],
                bins[-1]-1,
                sep="-")
base_mx_pror <- base_mx_pror %>% 
  mutate(age_group = cut(age,breaks = bins,
                         labels = labels, right = FALSE))
base_mx_5 <- base_mx_pror %>% 
  group_by(sex,age_group) %>% 
  summarise(pob = sum(pob,na.rm=TRUE),
            .groups = "drop")
datatable(base_mx_5, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Agrupación por edades quinquenales con la tabla de datos base_mx_pror

Tabla de datos agrupados por edades quinquenales base_mx_5

Code
library(tidyverse)
library(DT)
load("Input/base_mx_pror.RData")
bins   <- seq(0,max(base_mx_pror$age)+5,by = 5)
labels <- paste(bins[-length(bins)],
                bins[-1]-1,
                sep="-")
base_mx_pror <- base_mx_pror %>% 
  mutate(age_group = cut(age,breaks = bins,
                         labels = labels, right = FALSE))
base_mx_5 <- base_mx_pror %>% 
  group_by(sex,age_group) %>% 
  summarise(pob = sum(pob,na.rm=TRUE),
            .groups = "drop") %>% 
  mutate(pob2 = ifelse(sex=="males",-pob,pob))
datatable(base_mx_5, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Pirámide de población por edades quinquenales con la tabla de datos base_mx_5

Code
library(tidyverse)
base_mx_5 %>% 
  ggplot() +
  geom_bar(aes(x=age_group,y=pob2/1000000,fill=age_group),
           stat = "identity",
           show.legend = F)

Fuentes de información en demografía

Pirámide de población por edades quinquenales con la tabla de datos base_mx_5

Code
library(tidyverse)
base_mx_5 %>% 
  ggplot() +
  geom_bar(aes(x=age_group,y=pob2/1000000,fill=age_group),
           stat = "identity",
           show.legend = F)+
  coord_flip() +
  geom_hline(yintercept = 0)

Fuentes de información en demografía

Pirámide de población por edades quinquenales con la tabla de datos base_mx_5

Code
library(tidyverse)
base_mx_5 %>% 
  ggplot() +
  geom_bar(aes(x=age_group,y=pob2/1000000,fill=age_group),
           stat = "identity",
           show.legend = F)+
  coord_flip() +
  geom_hline(yintercept = 0) +
  scale_y_continuous(
    limits = c(-6,6),breaks = seq(-6,6,1),
    labels = as.character(c(
      seq(6,0,-1),
      seq(1,6,1)
    ))
  )

Fuentes de información en demografía

Pirámide de población por edades quinquenales con la tabla de datos base_mx_5

Code
library(tidyverse)
base_mx_5 %>% 
  ggplot() +
  geom_bar(aes(x=age_group,y=pob2/1000000,fill=age_group),
           stat = "identity",
           show.legend = F)+
  coord_flip() +
  geom_hline(yintercept = 0) +
  scale_y_continuous(
    limits = c(-6,6),breaks = seq(-6,6,1),
    labels = as.character(c(
      seq(6,0,-1),
      seq(1,6,1)
    ))
  ) +
  annotate(
    geom = "text",x=20,y=-3,label="Hombres",size=3
  ) +
  annotate(
    geom = "text",x=20,y=3,label = "Mujeres",color = "black", size=3
  )

Fuentes de información en demografía

Pirámide de población por edades quinquenales con la tabla de datos base_mx_5

library(tidyverse)
base_mx_5 %>% 
  ggplot() +
  geom_bar(aes(x=age_group,y=pob2/1000000,fill=age_group),
           stat = "identity",
           show.legend = F)+
  coord_flip() +
  geom_hline(yintercept = 0) +
  scale_y_continuous(
    limits = c(-6,6),breaks = seq(-6,6,1),
    labels = as.character(c(
      seq(6,0,-1),
      seq(1,6,1)
    ))
  ) +
  annotate(
    geom = "text",x=20,y=-3,label="Hombres",size=3
  ) +
  annotate(
    geom = "text",x=20,y=3,label = "Mujeres",color = "black", size=3
  ) +
  theme_light()+
  scale_fill_viridis_d(option = "C") 

Fuentes de información en demografía

Corrección

Tip

  • Sprague 1880
  • Beers 1945
  • Spline monótono (Fritsch and Carlson 1980)
  • PCLM (Rizzi, Gampe and Eilers 2015)

Fuentes de información en demografía

Tabla de datos desagregados o suavizados de la tabla de datos base_mx_5

La función pclm() se emplea para aplicar el método PCLM (Penalized Composite Link Model), que sirve para desagregar o suavizar datos agrupados. Este método es común en análisis demográficos, como la desagregación de datos de población o mortalidad que están agrupados por rangos de edad.

Code
library(ungroup)
library(tidyverse)
library(DT)
load("Input/base_mx_5.RData")
base_mx_5M <- base_mx_5 %>% 
  filter(sex=="females")
datatable(base_mx_5M, options = list(scrollX = TRUE, scrollY = "500px"))
Code
library(ungroup)
library(tidyverse)
library(DT)
load("Input/base_mx_5.RData")
base_mx_5H <- base_mx_5 %>% 
  filter(sex=="males")
datatable(base_mx_5H, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Tabla de datos desagregados o suavizados de la tabla de datos base_mx_5

Code
library(ungroup)
library(tidyverse)
library(DT)
load("Input/base_mx_5.RData")
base_mx_5M <- base_mx_5 %>% 
  filter(sex=="females")
base_mx_1_M <- pclm(x=bins[-length(bins)],
                    base_mx_5M$pob, nlast = 10) 
base_mx_1_M$fitted
       [0,1)        [1,2)        [2,3)        [3,4)        [4,5)        [5,6) 
9.615040e+05 9.789586e+05 9.964496e+05 1.013603e+06 1.029932e+06 1.044756e+06 
       [6,7)        [7,8)        [8,9)       [9,10)      [10,11)      [11,12) 
1.057381e+06 1.067350e+06 1.074382e+06 1.078709e+06 1.080769e+06 1.081214e+06 
     [12,13)      [13,14)      [14,15)      [15,16)      [16,17)      [17,18) 
1.080723e+06 1.079686e+06 1.078343e+06 1.076656e+06 1.074479e+06 1.071734e+06 
     [18,19)      [19,20)      [20,21)      [21,22)      [22,23)      [23,24) 
1.068396e+06 1.064637e+06 1.060726e+06 1.056899e+06 1.053347e+06 1.049965e+06 
     [24,25)      [25,26)      [26,27)      [27,28)      [28,29)      [29,30) 
1.046447e+06 1.042306e+06 1.036952e+06 1.030057e+06 1.021533e+06 1.011657e+06 
     [30,31)      [31,32)      [32,33)      [33,34)      [34,35)      [35,36) 
1.001016e+06 9.902263e+05 9.799096e+05 9.704372e+05 9.619133e+05 9.542412e+05 
     [36,37)      [37,38)      [38,39)      [39,40)      [40,41)      [41,42) 
9.470990e+05 9.400906e+05 9.327356e+05 9.245463e+05 9.150331e+05 9.039116e+05 
     [42,43)      [43,44)      [44,45)      [45,46)      [46,47)      [47,48) 
8.912271e+05 8.773544e+05 8.631965e+05 8.496559e+05 8.375644e+05 8.271755e+05 
     [48,49)      [49,50)      [50,51)      [51,52)      [52,53)      [53,54) 
8.174925e+05 8.069601e+05 7.929853e+05 7.734352e+05 7.477180e+05 7.164478e+05 
     [54,55)      [55,56)      [56,57)      [57,58)      [58,59)      [59,60) 
6.826588e+05 6.495553e+05 6.201972e+05 5.966579e+05 5.785048e+05 5.644505e+05 
     [60,61)      [61,62)      [62,63)      [63,64)      [64,65)      [65,66) 
5.515179e+05 5.366392e+05 5.179783e+05 4.946390e+05 4.678740e+05 4.395872e+05 
     [66,67)      [67,68)      [68,69)      [69,70)      [70,71)      [71,72) 
4.117990e+05 3.861387e+05 3.629256e+05 3.418966e+05 3.222028e+05 3.028857e+05 
     [72,73)      [73,74)      [74,75)      [75,76)      [76,77)      [77,78) 
2.834844e+05 2.638678e+05 2.444125e+05 2.256946e+05 2.081869e+05 1.922306e+05 
     [78,79)      [79,80)      [80,81)      [81,82)      [82,83)      [83,84) 
1.778315e+05 1.647953e+05 1.528045e+05 1.414835e+05 1.305017e+05 1.195859e+05 
     [84,85)      [85,86)      [86,87)      [87,88)      [88,89)      [89,90) 
1.085615e+05 9.735479e+04 8.605849e+04 7.489526e+04 6.417013e+04 5.421422e+04 
     [90,91)      [91,92)      [92,93)      [93,94)      [94,95)      [95,96) 
4.526795e+04 3.747658e+04 3.086054e+04 2.535278e+04 2.082913e+04 1.713565e+04 
     [96,97)      [97,98)      [98,99)     [99,100)    [100,101)    [101,102) 
1.408591e+04 1.146455e+04 9.112736e+03 6.916335e+03 4.898812e+03 3.172263e+03 
   [102,103)    [103,104)    [104,105)    [105,106)    [106,107)    [107,108) 
1.849636e+03 9.703979e+02 4.599960e+02 1.992295e+02 7.988055e+01 3.009239e+01 
   [108,109)    [109,110) 
1.081483e+01 3.764967e+00 
Code
library(ungroup)
library(tidyverse)
library(DT)
load("Input/base_mx_5.RData")
base_mx_5H <- base_mx_5 %>% 
  filter(sex=="males")
base_mx_1_H <- pclm(x=bins[-length(bins)],
                    base_mx_5H$pob, nlast = 10) 
base_mx_1_H$fitted
       [0,1)        [1,2)        [2,3)        [3,4)        [4,5)        [5,6) 
9.799637e+05 9.990057e+05 1.018113e+06 1.036878e+06 1.054771e+06 1.071047e+06 
       [6,7)        [7,8)        [8,9)       [9,10)      [10,11)      [11,12) 
1.084955e+06 1.096022e+06 1.103983e+06 1.109164e+06 1.112117e+06 1.113546e+06 
     [12,13)      [13,14)      [14,15)      [15,16)      [16,17)      [17,18) 
1.114120e+06 1.113944e+06 1.112839e+06 1.110166e+06 1.105153e+06 1.097451e+06 
     [18,19)      [19,20)      [20,21)      [21,22)      [22,23)      [23,24) 
1.087004e+06 1.074478e+06 1.060890e+06 1.047256e+06 1.034498e+06 1.022806e+06 
     [24,25)      [25,26)      [26,27)      [27,28)      [28,29)      [29,30) 
1.011878e+06 1.000974e+06 9.890959e+05 9.757686e+05 9.609704e+05 9.453652e+05 
     [30,31)      [31,32)      [32,33)      [33,34)      [34,35)      [35,36) 
9.301662e+05 9.164509e+05 9.051312e+05 8.963853e+05 8.896237e+05 8.838575e+05 
     [36,37)      [37,38)      [38,39)      [39,40)      [40,41)      [41,42) 
8.776592e+05 8.700069e+05 8.604611e+05 8.491417e+05 8.369107e+05 8.246439e+05 
     [42,43)      [43,44)      [44,45)      [45,46)      [46,47)      [47,48) 
8.131549e+05 8.028946e+05 7.937001e+05 7.851334e+05 7.763178e+05 7.663145e+05 
     [48,49)      [49,50)      [50,51)      [51,52)      [52,53)      [53,54) 
7.541357e+05 7.388889e+05 7.198690e+05 6.967803e+05 6.701937e+05 6.411428e+05 
     [54,55)      [55,56)      [56,57)      [57,58)      [58,59)      [59,60) 
6.115595e+05 5.832905e+05 5.579050e+05 5.364031e+05 5.183814e+05 5.029626e+05 
     [60,61)      [61,62)      [62,63)      [63,64)      [64,65)      [65,66) 
4.883576e+05 4.727681e+05 4.550688e+05 4.346470e+05 4.120225e+05 3.881060e+05 
     [66,67)      [67,68)      [68,69)      [69,70)      [70,71)      [71,72) 
3.640272e+05 3.408002e+05 3.189550e+05 2.987432e+05 2.800989e+05 2.628180e+05 
     [72,73)      [73,74)      [74,75)      [75,76)      [76,77)      [77,78) 
2.465713e+05 2.310007e+05 2.157360e+05 2.004589e+05 1.850735e+05 1.696444e+05 
     [78,79)      [79,80)      [80,81)      [81,82)      [82,83)      [83,84) 
1.545042e+05 1.400953e+05 1.267818e+05 1.148214e+05 1.041072e+05 9.430334e+04 
     [84,85)      [85,86)      [86,87)      [87,88)      [88,89)      [89,90) 
8.495912e+04 7.559317e+04 6.604724e+04 5.644540e+04 4.717088e+04 3.872146e+04 
     [90,91)      [91,92)      [92,93)      [93,94)      [94,95)      [95,96) 
3.141058e+04 2.537547e+04 2.053395e+04 1.667941e+04 1.359691e+04 1.107874e+04 
     [96,97)      [97,98)      [98,99)     [99,100)    [100,101)    [101,102) 
8.964059e+03 7.125145e+03 5.491966e+03 4.036630e+03 2.783691e+03 1.777315e+03 
   [102,103)    [103,104)    [104,105)    [105,106)    [106,107)    [107,108) 
1.040844e+03 5.595971e+02 2.773869e+02 1.279390e+02 5.548896e+01 2.289979e+01 
   [108,109)    [109,110) 
9.102229e+00 3.527280e+00 

Fuentes de información en demografía

Tabla de datos desagregados o suavizados de la tabla de datos base_mx_5

La función enframe() transforma el vector de poblaciones desagregadas o suavizadas (base_mx_1_H$fitted y base_mx_1_H$fitted) en un data frame con tres columnas:

•   age: Una columna con los valores de 0 a 109, que representa las edades desagregadas.

•   sex: Una columna que indica que todos los datos corresponden a mujeres y hombres.

•   pob: Los valores de la población desagregada o suavizada por edad.
Code
library(ungroup)
library(tidyverse)
library(DT)
load("Input/base_mx_5.RData")
base_mx_5M <- base_mx_5 %>% 
  filter(sex=="females")
base_mx_1_M <- pclm(x=bins[-length(bins)],
                    base_mx_5M$pob, nlast = 10) 
tabla_M  <- enframe(base_mx_1_M$fitted,
          name="age",value = "pob") %>% 
    mutate(age=c(0:109),sex="females",
           .before = pob)
datatable(tabla_M, options = list(scrollX = TRUE, scrollY = "500px"))
Code
library(ungroup)
library(tidyverse)
library(DT)
load("Input/base_mx_5.RData")
base_mx_5H <- base_mx_5 %>% 
  filter(sex=="males")
base_mx_1_H <- pclm(x=bins[-length(bins)],
                    base_mx_5H$pob, nlast = 10) 
tabla_H <- enframe(base_mx_1_H$fitted,
          name="age",value = "pob") %>% 
    mutate(age=c(0:109),sex="males",
           .before = pob)
datatable(tabla_H, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Tabla de datos desagregados o suavizados de la tabla de datos base_mx_5

Juntamos ambos Data.Frames para crear una nueva tabla de datos llamada base_mx_1, que contendran los datos desagregados.

Code
library(ungroup)
library(tidyverse)
library(DT)
base_mx_5H <- base_mx_5 %>% 
  filter(sex=="males")

base_mx_5M <- base_mx_5 %>% 
  filter(sex=="females")

base_mx_1_H <- pclm(x=bins[-length(bins)],
                    base_mx_5H$pob, nlast = 10) 

base_mx_1_M <- pclm(x=bins[-length(bins)],
                    base_mx_5M$pob, nlast = 10) 

base_mx_1 <- rbind(
  enframe(base_mx_1_H$fitted,
          name="age",value = "pob") %>% 
    mutate(age=c(0:109),sex="males",
           .before = pob)
  ,
  enframe(base_mx_1_M$fitted,
          name="age",value = "pob") %>% 
    mutate(age=c(0:109),sex="females",
           .before = pob))  %>% 
  mutate(pob2 = ifelse(sex=="males",-pob,pob))
datatable(base_mx_1, options = list(scrollX = TRUE, scrollY = "500px"))

Fuentes de información en demografía

Pirámide de población con los datos desagregados o suavizados de la tabla de datos base_mx_1

library(tidyverse)
load("Input/base_mx_1.RData")

base_mx_1 %>% 
  ggplot() +
  geom_bar(aes(x=age,y=pob2/1000000,fill=age),
           stat = "identity",
           show.legend = F
  ) +
  coord_flip() +
  geom_hline(yintercept = 0) +
  scale_y_continuous(
    limits = c(-1.25,1.25),breaks = seq(-1.25,1.25,0.25),
    labels = as.character(c(
      seq(1.25,0,-0.25),
      seq(0.25,1.25,0.25)
    ))
  ) +
  scale_x_continuous(
    limits = c(-1,110),
    breaks = seq(0,110,5),
    labels = seq(0,110,5)
  ) +
  annotate(
    geom = "text",x=95,y=-1,label="Hombres",size=3
  ) +
  annotate(
    geom = "text",x=95,y=1,label = "Mujeres",color = "black", size=3
  )+
  theme_light() +
  scale_fill_viridis_c(option = "A", guide = guide_colorbar()) 

Fuentes de información en demografía

Corrección

Fuentes de información en demografía

Tip

  • Registro tardío
  • Mala declaración de edad.
  • Sesgos

Fuentes de información en demografía

Tip

  • Error de muestreo
  • Representatividad

Conceptos básicos

  • \(proporción = \frac{Núm. \,de\, elementos\, de \,un\, subconjunto}{Núm.\, de\, elementos\, del\, total}\)
  • \(razón = \frac{Núm. \,de\, elementos\, de\, un\, subconjunto}{Núm. \,de\, elementos\, de \,otro \,subconjunto}\)
  • \(tasa = \frac{Núm.\, de \,veces\, que\, ocurre \,un\, evento}{Años-persona\, de\, exposición\, al\, riesgo}\)
  • \(probabilidad = \frac{Núm.\, de\, veces \,que \,ocurre\, un\, evento}{Núm.\, de \,casos\, igualmente \,factibles}\)

Tasas de periodo y años-persona

\(tasa[0,T] = \frac{Núm.\, de\, veces\, que\, ocurre\, un \, evento\, entre\,0 \,y\,T}{Años-persona\, vividos\, por\, la \,población \,entre\,0\,y\,T}\)

Tasas de periodo y años-persona

Tasas de periodo y años-persona

\(AP[t_1,t_2]= \sum_{i=t_1}^{t_2}N_i\Delta_i\)

\(AP[t_1,t_2]= \sum_{i=t_1}^{t_2}N_i\Delta_i\)

\(AP[t_1,t_2]= \int_{t_1}^{t_2}N(t)dt\)

Definición formal de la derivada

Decimos que una función, \(f:Dom(f)\to \mathbb{R}\), es derivable en un punto \(x\) si y solo si:

\(\lim_{h\to 0}\frac{f(x+h)-f(x)}{h}\)

existe.

Decimos que una función, \(f:Dom(f)\to \mathbb{R}\), es derivable en todo su dominio si y solo si para todo \(x\in Dom(f)\), f es derivable en \(x\)

Definición formal de la derivada

Animación gráfica de la derivada en un punto \(x\)

Tasas de crecimiento

\(r(t_1,t_2)=\frac{N(t_2)-N(t_1)}{AP[t_1,t_2]}\)

Tasas de crecimiento

\(r(t_1,t_2)=\frac{N(t_2)-N(t_1)}{AP[t_1,t_2]}\)

\(r(t)=\color{red}{\lim_{\Delta t \to 0}\frac{\Delta N(t)}{N(t)\Delta t}}\)

El diablo esta en los detalles

  • Pues se tiene que los años-persona \(AP[t_1,t_2] = N(t)(t_2 - t_1)= N(t)\Delta t\).
  • Además, al buscar el cambio instantaneo, hacemos \(t_1 \to t_2\), que se entiende como \(t_1\) toma valores cada vez parecidos a \(t_2\). En este sentido \(\Delta t=t_2-t_1 \to 0\), que se entiende que el cambio entre el tiempo \(t_1\) y \(t_2\) tiende a 0, toma valores cada vez mas cercanos a cero.

Tasas de crecimiento

\(r(t_1,t_2)=\frac{N(t_2)-N(t_1)}{AP[t_1,t_2]}\)

\(r(t)=\lim_{\Delta t \to 0}\frac{\Delta N(t)}{N(t)\Delta t}=\lim_{\Delta t \to 0}\color{red}{\frac{\Delta N(t)}{\Delta t}/\frac{N(t)}{1}}\)

El diablo esta en los detalles

Por la ley del “Sándwich”. Es decir, para \(a,b,c,d\) números reales,tenemos que \(\frac{a}{b}}/\frac{c}{d} = \frac{a.d}{b.c}\)

Tasas de crecimiento

\(r(t_1,t_2)=\frac{N(t_2)-N(t_1)}{AP[t_1,t_2]}\)

\(r(t)=\lim_{\Delta t \to 0}\frac{\Delta N(t)}{N(t)\Delta t}=\color{red}{\frac{\lim_{\Delta t \to 0}\frac{\Delta N(t)}{\Delta t}}{N(t)}}\)

El diablo esta en los detalles

  • Por la ley de cocientes para los límites \(\lim_{t\to a}\frac{f(t)}{g(t)}=\frac{\lim_{t\to a}f(t)}{\lim_{t\to a}g(t)}\)
  • En nuestro caso especifico tenemos que \(f(t)=\frac{\Delta N(t)}{\Delta t}\) y \(g(t)=\frac{N(t)}{1}\)
  • Notemos que \(\lim_{\Delta \to 0}N(t)= N(t)\), pues \(N(t)\) no depende de \(\Delta t\), es decir, no depende del cambio entre \(t_1\) y \(t_2\).

Tasas de crecimiento

\(r(t_1,t_2)=\frac{N(t_2)-N(t_1)}{AP[t_1,t_2]}\)

\(r(t)=\lim_{\Delta t \to 0}\frac{\Delta N(t)}{N(t)\Delta t}=\frac{\lim_{\Delta t \to 0}\frac{\Delta N(t)}{\Delta t}}{N(t)}=\color{red}{\frac{N^{'}(t)}{N(t)}}\)

El diablo esta en los detalles

Por la definición de la derivada en un punto \(t\): \(N^{'}(t)=\frac{dN(t)}{dt}=\lim_{\Delta t \to 0}\frac{N(t_2)-N(t_1)}{t_2-t_1}=\lim_{\Delta t\to 0}\frac{\Delta N(t)}{\Delta t}\)

Tasas de crecimiento

\(r(t_1,t_2)=\frac{N(t_2)-N(t_1)}{AP[t_1,t_2]}\)

\(r(t)=\lim_{\Delta t \to 0}\frac{\Delta N(t)}{N(t)\Delta t}=\frac{\lim_{\Delta t \to 0}\frac{\Delta N(t)}{\Delta t}}{N(t)}=\frac{N^{'}(t)}{N(t)}=\color{red}{\frac{d\, ln(N(t))}{dt}}\)

El diablo esta en los detalles

Por la derivada de \(In(t)\) en un punto \(t\): \(\frac{d}{dt}ln(t)=\frac{1}{t}\).

Y más en general, para cualquier función derivable \(f(t)\) \(\frac{d}{dt}ln[f(t)]=\frac{f^{'}(t)}{f(t)}\)

Tasas de crecimiento

\(r(t_1,t_2)=\frac{N(t_2)-N(t_1)}{AP[t_1,t_2]}\)

\(r(t)=\lim_{\Delta t \to 0}\frac{\Delta N(t)}{N(t)\Delta t}=\frac{\lim_{\Delta t \to 0}\frac{\Delta N(t)}{\Delta t}}{N(t)}=\frac{N^{'}(t)}{N(t)}=\frac{d\, ln(N(t))}{dt}\)

\(\color{red}{\int_{t_1}^{t_2}r(t)dt=\int_{t_1}^{t_2}\frac{d}{dt}ln(t)dt}\)

El diablo esta en los detalles

Integrando por ambos lados de la ecuación sobre el intervalo \((t_1,t_2)\)

Tasas de crecimiento

\(r(t_1,t_2)=\frac{N(t_2)-N(t_1)}{AP[t_1,t_2]}\)

\(r(t)=\lim_{\Delta t \to 0}\frac{\Delta N(t)}{N(t)\Delta t}=\frac{\lim_{\Delta t \to 0}\frac{\Delta N(t)}{\Delta t}}{N(t)}=\frac{N^{'}(t)}{N(t)}=\frac{d \,ln(N(t))}{dt}\)

\(\int_{t_1}^{t_2}r(t)dt=\int_{t_1}^{t_2}\frac{d}{dt}ln(t)=\color{red}{ln[N(t_2)]-ln[N(t1)]}\)

El diablo esta en los detalles

Por teorema fundamental del cálculo. En esencia, lo que nos dice el teorema, es que la derivada y la integral son operaciones inversas.

Tasas de crecimiento

\(r(t_1,t_2)=\frac{N(t_2)-N(t_1)}{AP[t_1,t_2]}\)

\(r(t)=\lim_{\Delta t \to 0}\frac{\Delta N(t)}{N(t)\Delta t}=\frac{\lim_{\Delta t \to 0}\frac{\Delta N(t)}{\Delta t}}{N(t)}=\frac{N^{'}(t)}{N(t)}=\frac{d \,ln(N(t))}{dt}\)

\(\int_{t_1}^{t_2}r(t)dt=\int_{t_1}^{t_2}\frac{d}{dt}ln(t)dt=ln[N(t_2)]-ln[N(t1)]=\color{red}{ln[\frac{N(t_2)}{N(t_1)}]}\)

El diablo esta en los detalles

Por leyes de los logaritmos. Para cualquiera números \(a\) y \(b\) se satisface \(ln(\frac{a}{b})=ln(a)-ln(b)\)

Tasas de crecimiento

\(r(t_1,t_2)=\frac{N(t_2)-N(t_1)}{AP[t_1,t_2]}\)

\(r(t)=\lim_{\Delta t \to 0}\frac{\Delta N(t)}{N(t)\Delta t}=\frac{\lim_{\Delta t \to 0}\frac{\Delta N(t)}{\Delta t}}{N(t)}=\frac{N^{'}(t)}{N(t)}=\frac{d \,ln(N(t))}{dt}\)

\(\int_{t_1}^{t_2}r(t)dt=\int_{t_1}^{t_2}\frac{d}{dt}ln(t)dt=ln[N(t_2)]-ln[N(t1)]=\color{red}{ln \left[ \frac{N(t_2)}{N(t_1)}\right]}\)

\(\color{red}{e^{\int_{t_1}^{t_2}r(t)dt}=e^{ln\left[\frac{N(t_2)}{N(t_1)}\right]}}\)

El diablo esta en los detalles

Aplicando la exponencial a ambos lados de la ecuación \(e^x\)

Tasas de crecimiento

\(r(t_1,t_2)=\frac{N(t_2)-N(t_1)}{AP[t_1,t_2]}\)

\(r(t)=\lim_{\Delta t \to 0}\frac{\Delta N(t)}{N(t)\Delta t}=\frac{\lim_{\Delta t \to 0}\frac{\Delta N(t)}{\Delta t}}{N(t)}=\frac{N^{'}(t)}{N(t)}=\frac{d \,ln(N(t))}{dt}\)

\(\int_{t_1}^{t_2}r(t)dt=\int_{t_1}^{t_2}\frac{d}{dt}in(t)dt=ln[N(t_2)]-ln[N(t1)]=\color{red}{ln\left[\frac{N(t_2)}{N(t_1)}\right]}\)

\(e^{\int_{t_1}^{t_2}r(t)dt}=\color{red}{\frac{N(t_2)}{N(t_1)}}\)

El diablo esta en los detalles

Esto es, pues, la exponencial, \(e^x\), y el logaritmo natural, \(In(x)\), son operaciones inversas Esto es \(e^{In(x)}=x\)

El diablo esta en los detalles

Ojo: \(In(e^x)=x\) si y solo si \(x>0\)

Tasas de crecimiento

\(r(t_1,t_2)=\frac{N(t_2)-N(t_1)}{AP[t_1,t_2]}\)

\(r(t)=\lim_{\Delta t \to 0}\frac{\Delta N(t)}{N(t)\Delta t}=\frac{\lim_{\Delta t \to 0}\frac{\Delta N(t)}{\Delta t}}{N(t)}=\frac{N^{'}(t)}{N(t)}=\frac{d \,ln(N(t))}{dt}\)

\(\int_{t_1}^{t_2}r(t)dt=\int_{t_1}^{t_2}\frac{d}{dt}ln(t)dt=ln[N(t_2)]-ln[N(t1)]=\color{red}{ln\left[\frac{N(t_2)}{N(t_1)}\right]}\)

\(e^{\int_{t_1}^{t_2}r(t)dt}=\frac{N(t_2)}{N(t_1)}\)

\(N(t_2)= \color{red}{N(t_1)e^{\int_{t_1}^{t_2}r(t)dt}}\)

El diablo esta en los detalles

Despejando \(N(t_2)\)

Tasas de crecimiento

\(r(t_1,t_2)=\frac{N(t_2)-N(t_1)}{AP[t_1,t_2]}\)

\(r(t)=\lim_{\Delta t \to 0}\frac{\Delta N(t)}{N(t)\Delta t}=\frac{\lim_{\Delta t \to 0}\frac{\Delta N(t)}{\Delta t}}{N(t)}=\frac{N^{'}(t)}{N(t)}=\frac{d In(N(t))}{dt}\)

\(\int_{t_1}^{t_2}r(t)dt=\int_{t_1}^{t_2}\frac{d}{dt}In(t)dt=ln[N(t_2)]-In[N(t1)]=In\left[\frac{N(t_2)}{N(t_1)}\right]\)

\(e^{\int_{t_1}^{t_2}r(t)dt}=\frac{N(t_2)}{N(t_1)}\)

\(N(t_2)= N(t_1)e^{\int_{t_1}^{t_2}r(t)dt}\)

\(\color{red}{\overline{r}(t_1,t_2)=\frac{\int_{t_1}^{t_2}r(t)dt}{t_2-t_1}=\frac{ln\left[\frac{N(t_1)}{N(t_2)}\right]}{t_2-t_1}}\)

El diablo esta en los detalles

  • Si \(r(t)=\overline{r}(t_1,t_2)\), entonces \(r(t)\) ya no depende de \(t\) y es ahora una constante.
  • Por lo tanto \(\int_{t_1}^{t_2}\overline{r}(t_1,t_2)dt=\overline{r}(t_1,t_2)\int_{t_1}^{t_2}dt\)
  • Por lo tanto \(\int_{t_1}^{t_2}\overline{r}(t_1,t_2)dt=\overline{r}(t_1,t_2)\int_{t_1}^{t_2}dt=\overline{r}(t_1,t_2)(t_2-t_1)\)

Series de Maclaurin

Una serie de Maclaurin para una función \(f(x)\) es una representación en forma de una suma infinita de potencias de \(x\). Para \(f\) derivable en \(0\), la serie se define como:

\(f(x) = f(0) + \frac{f'(0)}{1!}x + \frac{f''(0)}{2!}x^2 + \frac{f^{(3)}(0)}{3!}x^3 + \cdots\)

O en notación de suma infinita:

\(f(x) = \sum_{n=0}^{\infty} \frac{f^{(n)}(0)}{n!} x^n\)

El ejemplo particular que nos interesa es la serie de Maclaurin del logaritmo natural:

\(\ln(1+x) = \sum_{n=1}^{\infty} \frac{(-1)^{n-1}}{n} x^n = x - \frac{x^2}{2} + \frac{x^3}{3} - \cdots, \quad |x| < 1\)

Asi tenemos que ::: {style=“text-align: center; font-size: 1em; margin-top:50px;”} \(\ln(1+x) \approx x\) para \(n=1\) :::

Aproximación a los AP

\(AP[t_1,t_2]=\frac{N(t_2)-N(t_1)}{\overline{r}(t_1,t_2)}\)

Aproximación a los AP

\(AP[t_1,t_2]=\frac{N(t_2)-N(t_1)}{\overline{r}(t_1,t_2)}\)

\(\color{red}{=\frac{N(t_2)-N(t_1)}{\frac{In\left[\frac{N(t_2)}{N(t_1)}\right]}{t_2-t_1}}}\)

El diablo esta en los detalles

Por lo el resultado anterior cuando \(r(t)=\overline{r}(t_1,t_2)=\frac{ln\left[\frac{N(t_2)}{N(t_1)}\right]}{t_2-t_1}\)

Aproximación a los AP

\(AP[t_1,t_2]=\frac{N(t_2)-N(t_1)}{\overline{r}(t_1,t_2)}\)

\(=\frac{N(t_2)-N(t_1)}{\frac{ln[\frac{N(t_2)}{N(t_1)}]}{t_2-t_1}}\)

\(\color{red}{=\frac{N(t_2)-N(t_1).[t_2-t_1]}{ln\left[\frac{N(t_2)}{N(t_1)}\right]}}\)

El diablo esta en los detalles

Por la ley del “Sandwich”

Aproximación a los AP

El diablo esta en los detalles

En este apartado aproximaremos \(ln(\frac{N(t_2)}{N(t_1)})\)

  • \(N(t_2)=N(t_2)+0=N(t_2)+[N(t_1)-N(t_1)]=N(t_1)+[N(t_2)-N(t_1)]\)

  • \(\frac{N(t_2)}{N(t_1)}=1+\frac{N(t_2)-N(t_1)}{N(t_1)}\) dividiendo sobre \(N(t_1)\)

  • Sea \(x=\frac{N(t_2)-N(t_1)}{N(t_1)}\)

  • Para \(t_1\to t_2\) tenemos que \(N(t_1)\to N(t_2)\)

  • Lo que implica que cuando \(t_1\to t_2\) se tiene que \(N(t_1)\approx N(t_2)\)

  • Por lo tanto \(|x| \leq \left|\frac{N(t_2)-N(t_1)}{N(t_1)}\right|\leq \left|\frac{1}{N(t_1)}\right| = \frac{1}{N(t_1)} < 1\)

  • Se cumplen las hipótesis para aproximar \(ln(1+x)\) por su serie de Maclaurin

  • Asi tenemos que \(ln\left(\frac{N(t_2)}{N(t_1)}\right)=ln\left(1+\frac{N(t_2)-N(t_!)}{N(1)}\right)\approx \frac{N(t_2)-N(t_!)}{N(t_1)}\)

Aproximación a los AP

\(AP[t_1,t_2]=\frac{N(t_2)-N(t_1)}{\overline{r}(t_1,t_2)}\)

\(=\frac{N(t_2)-N(t_1)}{\frac{ln[\frac{N(t_2)}{N(t_1)}]}{t_2-t_1}}\)

\(=\frac{N(t_2)-N(t_1).[t_2-t_1]}{ln\left[\frac{N(t_2)}{N(t_1)}\right]}\)

\(AP[t_1,t_2]=\frac{N(t_2)-N(t_1).[t_2-t_1]}{\color{red}{\frac{N(t_2)-N(t_1)}{N(t_1)}}}\)

El diablo esta en los detalles

Por el apartado anterior

Aproximación a los AP

\(AP[t_1,t_2]=\frac{N(t_2)-N(t_1)}{\overline{r}(t_1,t_2)}\)

\(=\frac{N(t_2)-N(t_1)}{\frac{ln[\frac{N(t_2)}{N(t_1)}]}{t_2-t_1}}\)

\(=\frac{N(t_2)-N(t_1).[t_2-t_1]}{ln\left[\frac{N(t_2)}{N(t_1)}\right]}\)

\(AP[t_1,t_2]=\frac{N(t_2)-N(t_1).[t_2-t_1]}{{\frac{N(t_2)-N(t_1)}{N(t_1)}}}\)

\(AP[t_1,t_2]=\color{red}{N(t_1)}.[t_2-t_1]\)

El diablo esta en los detalles

Pues \(\frac{N(t_2)-N(t_1).[t_2-t_1]}{{\frac{N(t_2)-N(t_1)}{N(t_1)}}} = \frac{N(t_2)-N(t_1)}{N(t_2)-N(t_1)}.N(t_1)[t_2-t_1]=N(t_1)[t_2-t_1]\)

Aproximación a los AP

\(AP[t_1,t_2]=\frac{N(t_2)-N(t_1)}{\overline{r}(t_1,t_2)}\)

\(=\frac{N(t_2)-N(t_1)}{\frac{ln[\frac{N(t_2)}{N(t_1)}]}{t_2-t_1}}\)

\(=\frac{N(t_2)-N(t_1).[t_2-t_1]}{ln\left[\frac{N(t_2)}{N(t_1)}\right]}\)

\(AP[t_1,t_2]=\frac{N(t_2)-N(t_1).[t_2-t_1]}{{\frac{N(t_2)-N(t_1)}{N(t_1)}}}\)

\(AP[t_1,t_2]=N(t_1).[t_2-t_1]\)

\(AP[t_1,t_2]=\color{red}{\hat{N}(t_1)}.[t_2-t_1]\) donde \(\hat{N}(t_1)\) es la población a mitad de periodo entre \(t_1\) y \(t_2\)

El diablo esta en los detalles

Sabemos que:

  • \(N(t_1)\leq \hat{N}(t_1)\leq N(t_2)\)

  • Cuando \(t_1\to t_2\) tenemos que \(N(t_1)\approx \hat{N}(t_1)\approx N(t_2)\)

Diagrama de Lexis

Diagrama de Lexis

Edad

Diagrama de Lexis

Periodo

Diagrama de Lexis

Corte

Diagrama de Lexis


Diagrama de Lexis

Diagrama de Lexis

Diagrama de Lexis-Probabilidades cohorte por edad

\({}_1q_0^{\text{C1980}} = \frac{{}_1D_0^{\text{C1980}}}{B_0^{\text{C1980}}}\)

\({}_5q_{25}^{\text{C1980}} = \frac{{}_5D_{25}^{\text{C1980}}}{{}_5N_{25}^{\text{C1980}}}\)

Tasa especificas por edad de periodo

\({}_nM_x[t_1,t_2]=\frac{{}_nD_x[t_1,t_2]}{{}_nAP_x[t_1,t_2]}=\frac{{}_nD_x[t_1,t_2]}{(t_2-t_1){}_nN_x}\)

Nota

Usualmente \(t_2 - t_1 = n\)

Estandarización

Recordando

  1. \(tbm_{\text{Europa}}(2005,2010) = 11.3\)
  2. \(tbm_{\text{Africa}}(2005,2010) = 11.8\)
  3. \(tbm_{\text{Mundo}}(2005,2010) = 8.1\)
  4. \(tbm_{\text{Latam}}(2005,2010) = 5.8\)

Estandarización

\(\text{tbm}=\frac{D}{N}=\frac{\sum_{x=0}^\omega {}_nD_x}{N}\)

Estandarización

\(\text{tbm}=\frac{D}{N}=\frac{\sum_{x=0}^\omega {}_nD_x}{N}\)

\(\hspace{3.5cm}= \sum_{x=0}^{\omega}\frac{{}_nD_x}{N}\frac{{}_nN_x}{{}_nN_x}\)

Estandarización

\(\text{tbm}=\frac{D}{N}=\frac{\sum_{x=0}^\omega {}_nD_x}{N}\)

\(=\hspace{3.5cm}\sum_{x=0}^{\omega}\frac{{}_nD_x}{N}\frac{{}_nN_x}{{}_nN_x}\)

\(=\hspace{3.5cm} \sum_{x=0}^{\omega} \frac{{}_nD_x}{{}_nN_x} \frac{{}_nN_x}{N}\)

\(=\hspace{3.5cm}\sum_{x=0}^{\omega} {}_nM_x \hspace{0.5cm} {}_nC_x\)

donde

\(\sum_{x=0}^{\omega} {}_nC_x = \frac{\sum_{x=0}^{\omega +} {}_nN_x}{N}=1\)

Estandarización

Tomando la \({}_nC_x de Europa\)

\(tbm^*=\sum_{x=0}^{\omega} {}_nM^{Africa}_x \hspace{0.5cm} {}_nC^{Europa}_x\)

Estandarización

Tomando la \({}_nC_x\) de Europa

\(tbm^*=\sum_{x=0}^{\omega} {}_nM^{Africa}_x \hspace{0.5cm} {}_nC^{Europa}_x\)

En general

\(ASCDR^j= \sum_{x=0}^{\omega} {}_nM_x^{j}\,{}_nC_x^S\)

para \(j=A,B\) y

\({}_nC_x^S = \frac{{}_nC_x^A+{}_nC_x^B}{2}\)

Estandarización

Limpieza de la base de datos WPP2024 MORT F01 1 DEATHS SINGLE AGE BOTH_SEXES

La Tabla de Mortalidad

Datos observados

\({}_nN_x\) es la población a la mitad de año entre las edades \(x\) y \(x+n\)

\({}_nD_x\) son las defunciones totales que ocurridas entre las edades \(x\) y \(x+n\)

\({}_nm_x = \frac{{}_nd_x}{{}_nL_x}\simeq \frac{{}_nD_x}{{}_nN_x}\)

La Tabla de Mortalidad

Datos observados

\({}_nN_x\) es la población a la mitad de año entre las edades \(x\) y \(x+n\)

\({}_nD_x\) son las defunciones totales que ocurridas entre las edades \(x\) y \(x+n\)

\({}_nm_x = \frac{{}_nd_x}{{}_nL_x}\simeq \frac{{}_nD_x}{{}_nN_x}\)

\({}_nd_x = l_x-l_{x+n}=l_x\hspace{0.2cm}{}_nq_x\)

La Tabla de Mortalidad

Datos observados

\({}_nN_x\) es la población a la mitad de año entre las edades \(x\) y \(x+n\)

\({}_nD_x\) son las defunciones totales que ocurridas entre las edades \(x\) y \(x+n\)

\({}_nm_x = \frac{{}_nd_x}{{}_nL_x}\simeq \frac{{}_nD_x}{{}_nN_x}\)

\({}_nd_x = l_x-l_{x+n}=l_x\hspace{0.2cm}{}_nq_x\)

\({}_nq_x = \frac{{}_nd_x}{l_x}\)

La Tabla de Mortalidad

Datos observados

\({}_nN_x\) es la población a la mitad de año entre las edades \(x\) y \(x+n\)

\({}_nD_x\) son las defunciones totales que ocurridas entre las edades \(x\) y \(x+n\)

\({}_nm_x = \frac{{}_nd_x}{{}_nL_x}\simeq \frac{{}_nD_x}{{}_nN_x}\)

\({}_nd_x = l_x-l_{x+n}=l_x\hspace{0.2cm}{}_nq_x\)

\({}_nq_x = \frac{{}_nd_x}{l_x}\)

\({}_nL_x=nl_{x+n}+{}_nA_x=nl_{x+n}+{}_na_x/,{}_nd_x\)

Tabla de Mortalidad

Método de Greville y Chiang para el cálculo de $L_x$

Entonces:

\({}_nL_x=n(l_x-{}_nd_x)+{}_na_x\hspace{0.2cm}{}_nd_x\)

Método de Greville y Chiang para el cálculo de $L_x$

Entonces:

\({}_nL_x=n(l_x-{}_nd_x)+{}_na_x\hspace{0.2cm}{}_nd_x\)

\({}_nL_x=\color{red}{nl_x-n{}_nd_x}+{}_na_x\hspace{0.2cm}{}_nd_x\)

Ojo

Por propiedad distributiva, es decir, para cualesquiera \(a,x,y\) números se satisface: \(a*(x+y)=a*x+b*y\)

Método de Greville y Chiang para el cálculo de $L_x$

Entonces:

\({}_nL_x=n(l_x-{}_nd_x)+{}_na_x\hspace{0.2cm}{}_nd_x\)

\({}_nL_x=\color{red}{nl_x-n{}_nd_x}+{}_na_x\hspace{0.2cm}{}_nd_x\)

\(nl_x={}_nL_x+(n-{}_na_x){}_nd_x\)

La trampa esta en los pormenores

Despejando \(nl_x\). Asi pues:

  • \({}_nL_x=nl_x-n{}_nd_x+{}_na_x\hspace{0.2cm}{}_nd_x\)

  • \({}_nl_x={}_nL_x+n{}_nd_x-{}_na_x\hspace{0.2cm}{}_nd_x\) despejando \(nl_x\)

  • \({}_nl_x={}_nL_x+\color{red}{(n-{}_na_x){}_nd_x}\), por propiedad distributiva

Método de Greville y Chiang para el cálculo de $L_x$

Entonces:

\({}_nL_x=n(l_x-{}_nd_x)+{}_na_x\hspace{0.2cm}{}_nd_x\)

\({}_nL_x=nl_x-n{}_nd_x+{}_na_x\hspace{0.2cm}{}_nd_x\)

\(nl_x={}_nL_x+(n-{}_na_x){}_nd_x\)

\(l_x=\color{red}{\frac{1}{n}[{}_nL_x+(n-{}_na_x){}_nd_x]}\)

La trampa esta en los pormenores

Despejando \(l_x\)

Método de Greville y Chiang para el cálculo de $L_x$

Entonces:

\({}_nL_x=n(l_x-{}_nd_x)+{}_na_x\hspace{0.2cm}{}_nd_x\)

\({}_nL_x=nl_x-n{}_nd_x+{}_na_x\hspace{0.2cm}{}_nd_x\)

\(nl_x={}_nL_x+(n-{}_na_x){}_nd_x\)

\(l_x=\frac{1}{n}[{}_nL_x+(n-{}_na_x){}_nd_x]\)

Recordemos que:

\(\color{red}{{}_nq_x=\frac{{}_nd_x}{l_x}}\)

Método de Greville y Chiang para el cálculo de $L_x$

Entonces:

\({}_nL_x=n(l_x-{}_nd_x)+{}_na_x\hspace{0.2cm}{}_nd_x\)

\({}_nL_x=nl_x-n{}_nd_x+{}_na_x\hspace{0.2cm}{}_nd_x\)

\(nl_x={}_nL_x+(n-{}_na_x){}_nd_x\)

\(l_x=\frac{1}{n}[{}_nL_x+(n-{}_na_x){}_nd_x]\)

Recordemos que:

\({}_nq_x=\frac{{}_nd_x}{l_x} =\color{red}{ \frac{n\hspace{0.3cm}{}_nd_x}{{}_nL_x+(n-{}_na_x){}_nd_x}}\)

La trampa esta en los pormenores

Sustituyendo \({}_nl_x\) en \({}_nq_x\). Asi tenemos que:

  • \({}_nq_x = \color{red}{\frac{{}_nd_x}{\frac{1}{n}[{}_nL_x+(n-{}_na_x){}_nd_x]}}\)

Método de Greville y Chiang para el cálculo de $L_x$

Entonces:

\({}_nL_x=n(l_x-{}_nd_x)+{}_na_x\hspace{0.2cm}{}_nd_x\)

\({}_nL_x=nl_x-n{}_nd_x+{}_na_x\hspace{0.2cm}{}_nd_x\)

\(nl_x={}_nL_x+(n-{}_na_x){}_nd_x\)

\(l_x=\frac{1}{n}[{}_nL_x+(n-{}_na_x){}_nd_x]\)

Recordemos que:

\({}_nq_x=\frac{{}_nd_x}{l_x} =\color{red}{ \frac{n\hspace{0.3cm}{}_nd_x}{{}_nL_x+(n-{}_na_x){}_nd_x}}\)

La trampa esta en los pormenores

Sustituyendo \({}_nl_x\) en \({}_nq_x\). Asi tenemos que:

  • \({}_nq_x = \frac{{}_nd_x}{\frac{1}{n}[{}_nL_x+(n-{}_na_x){}_nd_x]} = \color{red}{\frac{n\hspace{0.3cm}{}_nd_x}{{}_nL_x+(n-{}_na_x){}_nd_x}}\)

Método de Greville y Chiang para el cálculo de $L_x$

Entonces:

\({}_nL_x=n(l_x-{}_nd_x)+{}_na_x\hspace{0.2cm}{}_nd_x\)

\({}_nL_x=nl_x-n{}_nd_x+{}_na_x\hspace{0.2cm}{}_nd_x\)

\(nl_x={}_nL_x+(n-{}_na_x){}_nd_x\)

\(l_x=\frac{1}{n}[{}_nL_x+(n-{}_na_x){}_nd_x]\)

Recordemos que:

\({}_nq_x=\frac{{}_nd_x}{l_x}= \frac{n\hspace{0.3cm}{}_nd_x}{{}_nL_x+(n-{}_na_x){}_nd_x} = \color{red}{\frac{\frac{n\hspace{0.3cm}{}_nd_x}{{}_nL_x}}{\frac{({}_nL_x+(n-{}_na_x){}_nd_x)}{{}_nL_x}}}\)

La trampa esta en los pormenores

Tomando en cuenta que

\(\frac{\frac{n\hspace{0.3cm}{}_nd_x}{{}_nL_x}}{\frac{({}_nL_x+(n-{}_na_x){}_nd_x)}{{}_nL_x}} = \frac{n\hspace{0.3cm}{}_nd_x\hspace{0.2cm}{}_nL_x}{({}_nL_x+(n-{}_na_x){}_nd_x){}_nL_x} = \frac{n\hspace{0.3cm}{}_nd_x}{{}_nL_x+(n-{}_na_x){}_nd_x}\) aplicando la ley del sandwich

Método de Greville y Chiang para el cálculo de $L_x$

Entonces:

\({}_nL_x=n(l_x-{}_nd_x)+{}_na_x\hspace{0.2cm}{}_nd_x\)

\({}_nL_x=nl_x-n{}_nd_x+{}_na_x\hspace{0.2cm}{}_nd_x\)

\(nl_x={}_nL_x+(n-{}_na_x){}_nd_x\)

\(l_x=\frac{1}{n}[{}_nL_x+(n-{}_na_x){}_nd_x]\)

Recordemos que:

\({}_nq_x=\frac{{}_nd_x}{l_x}= \frac{n\hspace{0.3cm}{}_nd_x}{{}_nL_x+(n-{}_na_x){}_nd_x} = \frac{\frac{n\hspace{0.3cm}{}_nd_x}{{}_nL_x}}{\frac{({}_nL_x+(n-{}_na_x){}_nd_x)}{{}_nL_x}} = \frac{n\hspace{0.2cm}{}_nm_x}{1+(n-{}_na_x){}_nm_x}\)

Repaso de la Tabla de Mortalidad

\({}_na_x=\frac{-\frac{n}{24}{}_nd_{x-n}+\frac{n}{2}{}_nd_x+\frac{n}{24}{}_nd_{x+n}}{{}_nd_x}\)

Pero cuando \(n=1\) entonces \({}_na_x=0.5\)

Repaso de la Tabla de Mortalidad

\({}_na_x=\frac{-\frac{n}{24}{}_nd_{x-n}+\frac{n}{2}{}_nd_x+\frac{n}{24}{}_nd_{x+n}}{{}_nd_x}\)

Pero cuando \(n=1\) entonces \({}_na_x=0.5\)

Para el último grupo de edad:

\({}_{\infty}q_x = 1\)

Repaso de la Tabla de Mortalidad

\({}_na_x=\frac{-\frac{n}{24}{}_nd_{x-n}+\frac{n}{2}{}_nd_x+\frac{n}{24}{}_nd_{x+n}}{{}_nd_x}\)

Pero cuando \(n=1\) entonces \({}_na_x=0.5\)

Para el último grupo de edad:

\({}_{\infty}q_x = 1\)

\({}_{\infty}L_x = \frac{l_x}{{}_{\infty}m_x}\)

Repaso de la Tabla de Mortalidad

\({}_na_x=\frac{-\frac{n}{24}{}_nd_{x-n}+\frac{n}{2}{}_nd_x+\frac{n}{24}{}_nd_{x+n}}{{}_nd_x}\)

Pero cuando \(n=1\) entonces \({}_na_x=0.5\)

Para el último grupo de edad:

\({}_{\infty}q_x = 1\)

\({}_{\infty}L_x = \frac{l_x}{{}_{\infty}m_x}\)

Finalmente se calculan

\(T_x = \sum_{a=x}^{\infty}{}_nL_a\)

\(e_x^0=\frac{T_x}{l_x}\)

Relaciones básicas de la mortalidad

Tasa instantánea de mortalidad

\(\mu(x)= \lim_{n\to 0}{}_nm_x\)

Relaciones básicas de la mortalidad

Tasa instantánea de mortalidad

\(\mu(x)= \lim_{n\to 0}{}_nm_x = \lim_{n\to 0}\frac{{}_nd_x}{{}_nL_x}\)

Relaciones básicas de la mortalidad

Tasa instantánea de mortalidad

\(\mu(x)= \lim_{n\to 0}{}_nm_x = \lim_{n\to 0}\frac{{}_nd_x}{{}_nL_x} = \lim_{n\to 0}\frac{l_x-l_{x+n}}{nL_x}\)

Relaciones básicas de la mortalidad

Tasa instantánea de mortalidad

\(\mu(x)= \lim_{n\to 0}{}_nm_x = \lim_{n\to 0}\frac{{}_nd_x}{{}_nL_x} = \lim_{n\to 0}\frac{l_x-l_{x+n}}{nL_x}=\color{red}{-\frac{dl(x)}{l(x)dx}}\)

La trampa esta en los pormenores

Aplicamos la definición de la derivada:

\(\lim_{n\to 0}\frac{l_x - l_{x+n}}{nl_x}=\lim_{n\to 0}-\frac{l_{x+n}-l_x}{nl_x}\)

Relaciones básicas de la mortalidad

Tasa instantánea de mortalidad

\(\mu(x)= \lim_{n\to 0}{}_nm_x = \lim_{n\to 0}\frac{{}_nd_x}{{}_nL_x} = \lim_{n\to 0}\frac{l_x-l_{x+n}}{nL_x}=\color{red}{-\frac{dl(x)}{l(x)dx}}\)

La trampa esta en los pormenores

Aplicamos la definición de la derivada:

\(\lim_{n\to 0}\frac{l_x - l_{x+n}}{nl_x}=\lim_{n\to 0}-\frac{l_{x+n}-l_x}{nl_x}\) factorizando un signo negativo

Relaciones básicas de la mortalidad

Tasa instantánea de mortalidad

\(\mu(x)= \lim_{n\to 0}{}_nm_x = \lim_{n\to 0}\frac{{}_nd_x}{{}_nL_x} = \lim_{n\to 0}\frac{l_x-l_{x+n}}{nL_x}=\color{red}{-\frac{dl(x)}{l(x)dx}}\)

La trampa esta en los pormenores

Aplicamos la definición de la derivada:

\(\lim_{n\to 0}\frac{l_x - l_{x+n}}{nl_x}=\lim_{n\to 0}-\frac{l_{x+n}-l_x}{nl_x}= -\frac{1}{l_x}\lim_{x\to 0}\frac{l_{x+n-l_x}}{n}\) pues el factor \(-\frac{1}{l_x}\) no depende de n y lo podemos sacar del límite.

Relaciones básicas de la mortalidad

Tasa instantánea de mortalidad

\(\mu(x)= \lim_{n\to 0}{}_nm_x = \lim_{n\to 0}\frac{{}_nd_x}{{}_nL_x} = \lim_{n\to 0}\frac{l_x-l_{x+n}}{nL_x}=\color{red}{-\frac{dl(x)}{l(x)dx}}\)

La trampa esta en los pormenores

Aplicamos la definición de la derivada:

\(\lim_{n\to 0}\frac{l_x - l_{x+n}}{nl_x}=\lim_{n\to 0}-\frac{l_{x+n}-l_x}{nl_x}= -\frac{1}{l_x}\lim_{x\to 0}\frac{l_{x+n-l_x}}{n}=-\frac{1}{l(x)}\frac{d}{dx}l(x)\) aplicando la definición de la derivada

Relaciones básicas de la mortalidad

Tasa instantánea de mortalidad

\(\mu(x)= \lim_{n\to 0}{}_nm_x = \lim_{n\to 0}\frac{{}_nd_x}{{}_nL_x} = \lim_{n\to 0}\frac{l_x-l_{x+n}}{nL_x}=-\frac{dl(x)}{l(x)dx}=\color{red}{-\frac{dInl(x)}{dx}}\)

La trampa esta en los pormenores

Recordemos que:

\(\frac{d}{dx}In[l(x)]=\frac{\frac{d}{dx}l(x)}{l(x)}=\frac{dl(x)}{l(x)dx}\)

Relaciones básicas de la mortalidad

Tasa instantánea de mortalidad

\(\mu(x)= \lim_{n\to 0}{}_nm_x = \lim_{n\to 0}\frac{{}_nd_x}{{}_nL_x} = \lim_{n\to 0}\frac{l_x-l_{x+n}}{nL_x}=-\frac{dl(x)}{l(x)dx}=\color{red}{-\frac{dInl(x)}{dx}}\)

Función de supervivencia

\(-\int_y^z\mu(x)dx=\)

Relaciones básicas de la mortalidad

Tasa instantánea de mortalidad

\(\mu(x)= \lim_{n\to 0}{}_nm_x = \lim_{n\to 0}\frac{{}_nd_x}{{}_nL_x} = \lim_{n\to 0}\frac{l_x-l_{x+n}}{nL_x}=-\frac{dl(x)}{l(x)dx}=\color{red}{-\frac{dInl(x)}{dx}}\)

Función de supervivencia

\(-\int_y^z\mu(x)dx=\int_y^z\frac{d}{dx}In[l(x)]dx\)

La trampa esta en los pormenores

Sustituyendo \(\mu(x)\) del bloque de Tasa instantánea de mortalidad

Relaciones básicas de la mortalidad

Tasa instantánea de mortalidad

\(\mu(x)= \lim_{n\to 0}{}_nm_x = \lim_{n\to 0}\frac{{}_nd_x}{{}_nL_x} = \lim_{n\to 0}\frac{l_x-l_{x+n}}{nL_x}=-\frac{dl(x)}{l(x)dx}=\color{red}{-\frac{dInl(x)}{dx}}\)

Función de supervivencia

\(-\int_y^z\mu(x)dx=\int_y^z\frac{d}{dx}In[l(x)]dx=In[l(z)]-In[l(y)]\)

La trampa esta en los pormenores

Por Teorema Fundamental del Cálculo

Relaciones básicas de la mortalidad

Tasa instantánea de mortalidad

\(\mu(x)= \lim_{n\to 0}{}_nm_x = \lim_{n\to 0}\frac{{}_nd_x}{{}_nL_x} = \lim_{n\to 0}\frac{l_x-l_{x+n}}{nL_x}=-\frac{dl(x)}{l(x)dx}=\color{red}{-\frac{dInl(x)}{dx}}\)

Función de supervivencia

\(-\int_y^z\mu(x)dx=\int_y^z\frac{d}{dx}In[l(x)]dx=In[l(z)]-In[l(y)] = In[\frac{l(z)}{l(y)}]\)

La trampa esta en los pormenores

Por Leyes de los logaritmos. Para cualquiera números \(a,b\), tenemos que \(In[\frac{a}{b}]=In(a)-In(b)\)

Relaciones básicas de la mortalidad

Tasa instantánea de mortalidad

\(\mu(x)= \lim_{n\to 0}{}_nm_x = \lim_{n\to 0}\frac{{}_nd_x}{{}_nL_x} = \lim_{n\to 0}\frac{l_x-l_{x+n}}{nL_x}=-\frac{dl(x)}{l(x)dx}=-\frac{dInl(x)}{dx}\)

Función de supervivencia

\(-\int_y^z\mu(x)dx=\int_y^z\frac{d}{dx}In[l(x)]dx=In[l(z)]-In[l(y)] = In[\frac{l(z)}{l(y)}]\)

\(\implies \color{red}{l(z)=l(y)e^{-\int_y^z\mu(z)dx}}\)

La trampa esta en los pormenores

Despejando \(l(z)\):

  • \(e^{-\int_y^z\mu(x)dx}=e^{In[\frac{l(z)}{l(y)}]}\) aplicando \(e^x\) para todo \(x\)

  • \(e^{-\int_y^z\mu(x)dx}=\frac{l(z)}{l(y)}\) pues \(e^{In(x)}=x\) para todo \(x\)

  • \(l(z)=l(y)e^{-\int_y^z\mu(x)dx}\)

Relaciones básicas de la mortalidad

Tasa instantánea de mortalidad

\(\mu(x)= \lim_{n\to 0}{}_nm_x = \lim_{n\to 0}\frac{{}_nd_x}{{}_nL_x} = \lim_{n\to 0}\frac{l_x-l_{x+n}}{nL_x}=-\frac{dl(x)}{l(x)dx}=-\frac{dInl(x)}{dx}\)

Función de supervivencia

\(-\int_y^z\mu(x)dx=\int_y^z\frac{d}{dx}In[l(x)]dx=In[l(z)]-In[l(y)] = In[\frac{l(z)}{l(y)}]\)

\(\implies \color{red}{l(z)=l(y)e^{-\int_y^z\mu(z)dx}}\)

Entonces: \(l(x)=l(0)e^{-\int_0^x\mu(t)dt}\)

La trampa esta en los pormenores

Si tomamos en cuenta \(y=x\) y \(z=0\)

Relaciones básicas de la mortalidad

Tasa instantánea de mortalidad

\(\mu(x)= \lim_{n\to 0}{}_nm_x = \lim_{n\to 0}\frac{{}_nd_x}{{}_nL_x} = \lim_{n\to 0}\frac{l_x-l_{x+n}}{nL_x}=-\frac{dl(x)}{l(x)dx}=-\frac{dInl(x)}{dx}\)

Función de supervivencia

\(-\int_y^z\mu(x)dx=\int_y^z\frac{d}{dx}In[l(x)]dx=In[l(z)]-In[l(y)] = In[\frac{l(z)}{l(y)}]\)

\(\implies \color{red}{l(z)=l(y)e^{-\int_y^z\mu(z)dx}}\)

Entonces: \(l(x)=l(0)e^{-\int_0^x\mu(t)dt}\)

Si tomamos \(l(0)=1\), obtenemos:

\(l(x)=e^{-\int_0^x\mu(t)dt}\)

Relaciones básicas de la mortalidad (otra perspectiva)

Definamos a \(X\) como al evento de que una persona muere en un tiempo \(t\). Entoces tenemos que:

\(q(X)= \lim_{\Delta t \to 0}\frac{P(X\in(x,x+\Delta))}{\Delta t}\)

es una función de densidad. Y

\(Q(x)=P(X\leq x)= \int q(x)dx\)

es una función de distribución

La trampa esta en los pormenores

Vayamos con calma en este bloque. Una función de densidad o función de probabilidad,\(f\),es una función que cumple con las siguinetes tres propiedades.

  • \(f(x)>0\), es decir, es positiva para todo \(x\) en su dominio o sus valores permitidos.

  • \(\int_{Dom(x)}f(x)=1\), es decir, la integral sobre todo el dominio de la función \(f\) es 1.

  • \(f(x)\leq 1\) es decir, es menor o igual a 1

Relaciones básicas de la mortalidad (otra perspectiva)

Definamos a \(X\) como al evento de que una persona muere en un tiempo \(t\). Entoces tenemos que:

\(q(X)= \lim_{\Delta t \to 0}\frac{P(X\in(x,x+\Delta t))}{\Delta t}\)

es una función de densidad. Y

\(Q(x)=P(X\leq x)= \int q(x)dx\)

es una función de distribución

La trampa esta en los pormenores

Porque son importantes las funciones de probabilidad?

  • Como su nombre lo sugiere, estas funciones nos permitirán calcular probabilidades de nuestros eventos.
  • f(x)=P(X=x) se lee como, la probabilidad de que X sea igual al evento x.
  • En nuestro contexto, se lee como la probabilidad de que una persona muera en el tiempo determinado \(x\).

Relaciones básicas de la mortalidad (otra perspectiva)

Definamos a \(X\) como al evento de que una persona muere en un tiempo \(t\). Entoces tenemos que:

\(q(X)= \lim_{\Delta t \to 0}\frac{P(X\in(x,x+\Delta t))}{\Delta t}\)

es una función de densidad. Y

\(Q(x)=P(X\leq x)= \int q(x)dx\)

es una función de distribución

Tasa instantanea de mortalidad

\(\mu(X)= \lim_{\Delta x \to0} \frac{P(X\in (x,x+\Delta x)|Se\,llegó\, con \,vida\, al\, tiempo\,x )}{\Delta x}\)

El diablo esta en los detalles

\(\mu(X)= \lim_{\Delta x \to0} \frac{P(X\in (x,x+\Delta x)|Se\,llegó\, con \,vida\, al\, tiempo\,x )}{\Delta x}\)

Relaciones básicas de la mortalidad (otra perspectiva)

Definamos a \(X\) como al evento de que una persona muere en un tiempo \(t\). Entoces tenemos que:

\(q(X)= \lim_{\Delta t \to 0}\frac{P(X\in(x,x+\Delta t))}{\Delta t}\)

es una función de densidad. Y

\(Q(x)=P(X\leq x)= \int q(x)dx\)

es una función de distribución

Tasa instantanea de mortalidad

\(\mu(X)= \lim_{\Delta x \to0} \frac{P(X\in (x,x+\Delta x)|Se\,llegó\, con \,vida\, al\, tiempo\,x )}{\Delta x}\)

El diablo esta en los detalles

\(\mu(X)= \lim_{\Delta x \to0} \frac{P(X\in (x,x+\Delta x)|Se\,llegó\, con \,vida\, al\, tiempo\,x )}{\Delta x}\)

\(\frac{q(X)}{1-Q(X)}=\frac{q(X)}{l(X)}\)

Relaciones básicas de la mortalidad (otra perspectiva)

Función de sobrevivencia

Como \(q(X)\) es una función de densidad, entonces:

\(q(X) = \frac{dQ(X)}{dx}=\frac{d[1-l(X)]}{dx}=-\frac{dl(X)}{dx}\)

Relaciones básicas de la mortalidad (otra perspectiva)

Función de sobrevivencia

Como \(q(X)\) es una función de densidad, entonces:

\(q(X) = \frac{dQ(X)}{dx}=\frac{d[1-l(X)]}{dx}=-\frac{dl(X)}{dx}\)

por lo que

\(\mu(X)=\frac{q(X)}{l(X)}=-\frac{dl(X)}{l(X)dx}=-\frac{dIn[l(X)]}{dx}\)

Relaciones básicas de la mortalidad (otra perspectiva)

Función de sobrevivencia

Como \(q(X)\) es una función de densidad, entonces:

\(q(X) = \frac{dQ(X)}{dx}=\frac{d[1-l(X)]}{dx}=-\frac{dl(X)}{dx}\)

por lo que

\(\mu(X)=\frac{q(X)}{l(X)}=-\frac{dl(X)}{l(X)dx}=-\frac{dIn[l(X)]}{dx}\)

de lo que se sigue que:

\(l(x)=e^{-\int_0^x \mu(t)dt}\)

Relaciones básicas de la mortalidad (resumen)

  • \(\mu(x)=-\frac{dIn[l(x)]}{dx}\)
  • \(l(x)=e^{-\int_0^x\mu(t)dt}\)
  • \(q(x)=\mu(x)e^{-\int_0^x\mu(t)dt}\)

Patrones modelo de la mortalidad

Modelo de Gompertz

\(\mu(x)=BC^x\)

Patrones modelo de la mortalidad

Modelo de Gompertz

\(\mu(x)=BC^x\)

Modelo de Gompertz-Makeham

\(\mu(x)=A+BC^x\)

Patrones modelo de la mortalidad

Modelo de Gompertz

\(\mu(x)=BC^x\)

Modelo de Gompertz-Makeham

\(\mu(x)=A+BC^x\)

Modelo de Weibull

\(\mu(x)=kx^n\)

Patrones modelo de la mortalidad

Modelo de Gompertz

\(\mu(x)=BC^x\)

Modelo de Gompertz-Makeham

\(\mu(x)=A+BC^x\)

Modelo de Weibull

\(\mu(x)=kx^n\)

Modelo de Heligman y Pollard

\(\mu(x)=A^{(x+B)^C}+De^{-E(In(x)-In(F)^2)}+GH^x\)

Patrones modelo de la mortalidad

Otras relaciones en la mortalidad

Ecuacion 1

\({}_nL_x=\int_0^nl(x+t)dt\)

Otras relaciones en la mortalidad

Ecuacion 1

\({}_nL_x=\int_0^nl(x+t)dt\)

Ecuacion 2

\({}_nd_x=\int_0^nl(x+t)\mu(x+t)dt\)

Otras relaciones en la mortalidad

Ecuacion 1

\({}_nL_x=\int_0^nl(x+t)dt\)

Ecuacion 2

\({}_nd_x=\int_0^nl(x+t)\mu(x+t)dt\)

Ecuacion 3

\(T_x=\int_0^{\omega-x}l(x+t)dt=\int_0^{\omega-x}l(x+t)dt\)

Otras relaciones en la mortalidad

Ecuacion 1

\({}_nL_x=\int_0^nl(x+t)dt\)

Ecuacion 2

\({}_nd_x=\int_0^nl(x+t)\mu(x+t)dt\)

Ecuacion 3

\(T_x=\int_0^{\omega-x}l(x+t)dt=\int_0^{\omega-x}l(x+t)dt\)

Ecuacion 4

\(e_x=\frac{\int_0^{\omega-x}t*l(x+t)\mu(x+t)dt}{\int_0^{\omega-x}l(x+t)\mu(x+t)dt}=\frac{\int_0^{\omega-x}l(x+t)dt}{l(x)}\)

Modelos relacionales de la mortalidad (Brass 1971)

\(\hat{Y}(x)=logit[q(x)]=0.5In\left[ \frac{q(x)}{1-q(x)} \right]\)

\(\hat{Y}(x)=\alpha+\beta\hat{Y}^S(x)\)

Proyección logística de la mortalidad

\(e_0(t)=k_1+\frac{k_2}{1+e^{a+bt}}\)

El modelo de Lee y Carter

\(In(m_{x,t})=a_x+b_xk_t+\epsilon_{x,t}\)

sujeto a:

\(\sum_{t=0}^n k_t=0\)

\(\sum_{t=0}^{\omega} b_x=0\)

Estimación 1.Descomposición de Valores Singulares

Dada las restricciones del modelo, se sigue que:

\(\sum_{t=0}^n In(m_{x,t})=\sum_{t=0}^n a_z + \sum_{t=0}^n b_xk_t\)

\(\sum_{t=0}^{\omega} In(m_{x,t})=na_x\)

Por lo que:

\(\hat{a}=\frac{\sum_{t=1}^n In(m_{x,t})}{n}\)

Entonces:

\(In(m_{x,t})-\hat{a}=b_xk_t\)

Descomposición en Valores Singulares

Formalmente, la factorización DVS indica que para toda \(\textbf{A} \in \mathbb{R}^{m\times n}\) de rango \(r\), existen matrices ortogonales \(\textbf{U}_{m\times n}\) y \(\textbf{V}_{n\times n}\) y una matriz diagonal \(\textbf{D}_{n\times n}=diag(\sigma_1,\sigma_2,...,\sigma_n)\) tales que:

\(\textbf{A}=\textbf{UDV}^t\,\sigma_1\geq\sigma_2\geq...\geq \sigma_n\)

Las \(\sigma_i^{'}s\) son los valores singulares de \(\textbf{A}\). En la factorización anterior, a las solumnas de \(\textbf{U}\) y \(\textbf{V}\) se les denomina vectores singulares de \(\textbf{A}\) izquierdos y derechos, respectivamente. Entonces \(b_x\) se encuentra estimado por el primer vector propio izquierdo y \(k_t\) está determinado por la primera componente principal considerando el primer vector propio derecho determinado por el máximo eigenvalor \(\sigma_1\). De hecho, en general:

\(In(m_{x,t})=a_x+b_{x1}k_{kt1}+b_{x2}k_{t2}+...+b_{xn}k_{tn}\)

donde, \(\epsilon_{x,t}=b_{x2}k_{t2}+...+b_{xn}k_{tn}\)

Criterios de minimización

El criterio de minimización apropiado se encuentra dado por el cálculo de la devianza:

\(devianza_t = 2\sum_{x=0}^{\omega+} \left[D_{x,t}In\left( \frac{D_{x,t}}{D^{'}_{x,t}} \right)-(D_{x,t}-D^{'}_{x,t}) \right]\)

La devianza es imilar al cálculo de la prueba \(\chi-cuadrada\) para la bondad de ajuste de \(D^{'}_{x,t}\) además de que el cálculo es mas sencillo:

\(\chi^2=\sum_{t=1}^n\sum_{x=0}^{\omega+}\left[ \frac{(D_{x,t}-D^{'}_{x,t})^2}{D^{'}_{x,t}} \right]\)

donde \(D_{x,t}\) son las defunciones totales de los individuos a edad \(x\) ocurridas durante el año \(t\). Esta ecuación es utilizada para comparar la bondad de ajuste entre los modelos, el criterio de discriminación es: aquel modelo que presente la \(\chi^2\) menor es el que ajusta mejor a los datos de las defunciones.

Coeficiente de determinación

\(R^2 = 1 - \frac{\sum_{t=1}^{n} \sum_{x=0}^{w+} \left[ \ln(m_{x,t}) - a_x - b_x k_t \right]^2}{\sum_{t=1}^{n} \sum_{x=0}^{w+} \left[ \ln(m_{x,t}) - a_x \right]^2}\)

\(= 1 - \frac{\sum_{t=1}^{n} \sum_{x=0}^{w+} \varepsilon_{x,t}^2}{\sum_{t=1}^{n} \sum_{x=0}^{w+} \left[ \ln(m_{x,t}) - a_x \right]^2}.\)

Estimación 2. Broothet al(2001)

Refinamiento, habiendo estimado \(a_x\) y \(b_x\) de acuerdoa LC

\(k_t=\frac{In(m_{x,t})-a_{x,1}}{b_{x,1}}\)

Estimación 3. LC alternativo

Habiendo estimado \(a_x\)

\(k_t=\sum{}_{x=0}^{\omega}(In(m_{x,t})-a_x)\)

Entonces, \(b_x\) se estima por MCO

\(b_x=\frac{\sum{}_{x=0}^{\omega}(In(m_{x,t})-a_x)}{\sum_{t=0}^{n}k_t^2}\)